为 什么 要 写 这 本 书 


我 早年 毕业 后 ， 曾 长 期 从 事 ERP、 电 子 政务 类 软件 的 开发 工作 ， 作 为 一 个 数据 库 的 使 用 者 ， 我 接触 到 了 大 量 数据 库 ， 如 FoxPro、SQL Server、Oracle、Informix.….. 在 不 断 的 使 用 过 程 中 ， 我 对 这 一 领 
域 越 来 越 感 兴趣 ， 并 最 终 选 择 了 数据 库 这 条 路 。 曾 经 长 期 担任 DBA、 数 据 库 架 构 师 等 职 ， 参 与 了 大 大 小 小 很 多 项 目的 数据 库 设 计 、 开 发 、 优 化 工作 ， 并 在 这 一 过 程 中 积累 了 一 些 经 验 。 在 多 年 的 工作 中 ， 我 
发 现 数据 库 领域 存在 一 些 现象 。 


现象 一 ， 开 发 人 员 将 数据 库 视 为 “ 黑 盒子 ”。 开 发 人 员 不 关心 、 不 重视 ， 也 不 了 解 SQL 语 名 的 执行 情况 、 数 据 库 的 运行 机 理 。 甚 至 在 很 多 O/R Mapping 工 具 的 辅助 下 ， 连 基本 的 SQL 语句 也 不 需要 手工 
编写 。 固 然 ， 通 过 引入 这 些 工具 可 以 大 大 加 快 研发 速度 ， 但 其 带 来 的 浆 端 是 ， 开 发 人 员 并 不 了 解数 据 库 是 如 何 完成 这 些 请 求 并 获得 数据 的 ， 优 化 更 是 无 从 谈 起 。 


现象 二 ， 对 SQL 质量 重视 程度 不 足 。 我 在 长 期 的 工作 中 发 现 ， 绝 大 多 数 公 司 对 SQL 质量 的 重视 程度 严重 不 足 。 往 往 在 项 目的 前 期 设计 、 代 码 开发 、 测 试 等 多 个 环节 ， 都 没有 DBA 的 参与 。 直 到 项 目 上 
线 ， 甚 至 到 出 现 性 能 问题 时 ， 才 会 有 DBA 介 入 处 理 。 这 种 救火 员 的 模式 ， 往 往 效果 不 好 ， 即 使 有 了 解决 方案 ， 其 代价 、 成 本 也 必然 是 巨大 的 。 


现象 三 ， 开 发 人 员 想 提高 却 无 从 下 手 。 有 些 开 发 人 员 认识 到 SQL 语句 质量 的 重要 性 ， 想 要 提高 却 无 从 下 手 。 一 方面 ， 他 们 本 身 不 具备 数据 库 的 专业 知识 ; 另 一 方面 ，SQL 编 程 本 身 也 有 : 
他 常用 开发 语言 有 较 大 差异 。 正 是 这 些 因素 ， 导 致 开发 人 员 想 要 提高 却 困难 重重 。 


特殊 性 ， 与 


现象 四 ， 重 运行 维护 ， 轻 开发 优化 。 数 据 库 的 稳定 运行 、 数 据 安全 等 是 非常 重要 的 ， 这 也 是 DBA 的 核心 职责 之 一 。 但 对 于 开发 优化 ， 则 往往 存在 重视 程度 不 足 的 问题 。 我 们 经 常会 看 到 一 个 项 目 里 ， 公 
司 会 花 大 笔 费 用 购买 昂贵 的 硬件 、 备 份 软件 等 ， 却 不 舍得 购买 与 数据 库 优化 、SQL 审 计 相 关 的 软件 。 此 外 ， 随 着 自动 化 运 维 的 逐步 推广 ， 乃 至 数据 库 云 服务 的 逐步 成 熟 ， 传 统 意义 的 数据 库 运 维 工 作 必然 会 
逐步 萎缩 ， 取 而 代 之 的 则 是 数据 库 的 设计 、 开 发 乃至 整体 架构 工作 逐步 增多 。 这 也 是 DBA 未 来 发 展 的 一 个 方向 。 


现象 五 ， 资 料 繁多 ， 却 无 从 选择 。Oracle 数 据 库 在 国内 流行 多 年 ， 该 领域 的 书籍 也 非常 多 ， 但 涉及 优化 类 的 相对 较 少 ， 特 别 是 局 限 在 SQL 语句 优化 范畴 的 。 近 年 来 我 也 发 现 了 几 本 不 错 的 书籍 ， 但 普遍 
存在 技术 偏 深 、 可 操作 性 不 强 的 问题 。 广 大 数据 库 开发 的 初学 者 或 者 有 一 定 经 验 但 急需 提高 的 读者 ， 不 太 适 用 。 


正 是 因为 存在 上 述 种 种 现象 ， 促 使 我 有 了 将 多 年 的 经 验 汇集 成 肌 ， 编 写 出 版 的 想法 。 一 方面 是 能 够 帮助 有 相关 需求 的 人 ， 另 一 方面 也 是 对 自己 多 年 工作 的 一 个 总 结 。 最 后 ， 希 望 这 本 书 能 够 引领 开发 人 
员 、DBA 在 SQL 语句 的 编写 优化 上 更 进一步 。 倘 若 这 本 书 能 够 帮助 大 家 解决 实际 中 遇 到 的 问题 ， 我 将 非常 荣幸 。 


本 书 特色 


本 书 从 多 角度 阐述 了 SQL 语句 优化 的 方方面面 ， 总 体 上 可 分 为 两 大 部 分 。 第 一 部 分 主要 讲解 跟 SQL 优 化 相关 的 背景 知识 和 基本 原理 ; 第 二 部 分 重点 讲述 了 优化 器 的 各 种 优化 手段 。 本 书 整 体 具有 以 下 几 
个 特点 : 


“ 书 中 内 容 由 项 目 而 生 ， 以 一 线 开 发 工程 师 的 视角 和 言语 展开 。 
“ 注重 实战 。 几 乎 所 有 的 章节 都 配 以 代码 ， 读 者 可 在 环境 中 直接 编写 代码 并 运行 。 大 部 分 代码 都 附 有 详细 的 说 明 ， 便 于 读者 理解 内 容 。 


“ 涵盖 了 SQL 语句 的 诸多 方面 ， 特 别 是 第 二 部 分 ， 可 作为 工作 手册 供 大 家 优化 时 查阅 使 用 。 


读者 对 象 


本 书 适 用 于 想 要 提高 SQL 语句 运行 效率 乃至 数据 库 整体 性 能 的 所 有 人 ， 包 括 架 构 师 、DBA、 开 发 人 员 、 测 试 人 员 等 。 书 中 讲解 了 Oracle 数 据 库 的 SQL 语句 优化 ， 但 除了 个 别 Oracle 自 有 的 优化 特性 外 ， 
其 核心 思想 也 适用 于 其 他 关系 型 数据 库 。 书 中 没有 讲解 Oracle 体 系 结构 和 SQL 语言 本 身 ， 这 里 假设 大 部 分 人 已 熟悉 Oracle 和 SQL 语言 。 具 体 来 说 ， 包 括 但 不 局 限于 下 列 人 员 : 


“ Oracle 数据 库 开 发 人 员 ; 

“ 数据 库 架 构 师 、 数 据 库 管理 员 ; 
“ 其 他 关系 型 数据 库 的 从 业者 ; 

“ 对 SQL 语句 优化 感 兴趣 的 人 员 ; 


“大专 院 校 计算 机 相关 专业 的 学 生 。 


如 何 阅读 本 书 


本 书 分 为 四 大 部 分 : 


第 一 部 分 为 引入 篇 (第 0~1 章 ) 。 


引言 部 分 我 结合 多 年 的 工作 经 验 ， 总 结 了 进行 SQL 语句 优化 时 可 能 会 面临 的 一 些 问题 。 读 者 可 以 观察 是 否 在 自己 的 身边 也 存在 类 似 的 问题 。 后面 还 讲述 了 一 些 常见 的 关于 SQL 优化 的 误区 ， 以 方便 读者 
正确 看 待 SQL 语句 优化 。 


第 1 章 讲述 了 我 曾经 处 理 过 的 几 个 案例 。 通 过 这 些 活生生 的 案例 ， 可 以 让 读者 更 直观 感受 到 SQL 语句 优化 的 重要 。 同 时 在 每 个 案例 后 面 ， 我 还 针对 案例 出 现 的 问题 进行 了 总 结 。 


第 二 部 分 为 原理 篇 (第 2~9 章 ) 。 


第 2 章 讲述 了 SQL 语句 优化 的 核心 组 件 一 一 优化 器 ， 以 及 优化 的 最 基础 概念 一 一 成 本 。 这 部 分 非常 重要 ， 建 议 初 学 者 仔细 阅读 。 


第 3~6 章 介绍 了 和 优化 相关 的 几 个 重要 概念 : 执行 计划 、 统 计 信 息 、SQL 解 析 、 游 标 、 绑 定 变量 。 这 部 分 都 较为 基础 ， 建 议 初 学 者 根据 情况 选择 阅读 。 


第 7~8 章 介绍 了 SQL 语句 的 实体 对 象 及 物理 上 是 如 何 存储 的 。 这 部 分 对 于 数据 库 结构 设计 有 较 大 帮助 。 此 外 ， 在 对 SQL 语句 进行 优化 时 ， 也 需要 考虑 相关 对 象 的 情况 ， 因 为 优化 措施 可 能 会 影响 该 对 象 的 
其 他 语句 ， 需 要 统筹 考虑 。 


第 9 章 介 绍 了 Oracle 专 有 的 一 些 SQL 语 句 。 有 时 使 用 这 些 语句 ， 可 以 达到 意 想 不 到 的 效果 。 如 不 考虑 以 后 有 数据 库 平台 迁移 的 问题 ， 可 以 充分 利用 这 些 语句 。 


原理 篇 是 我 们 是 迈 入 实战 篇 的 基础 ， 它 几乎 覆盖 了 SQL 优化 相关 的 所 有 原理 知识 。 通 过 对 这 些 内 容 的 学 习 ， 可 以 为 后 面 的 优化 部 分 打下 良好 的 基础 。 如 果 你 已 经 拥有 相关 知识 ， 可 以 直接 进入 实战 篇 。 


第 三 部 分 为 实战 篇 (第 10~16 章 ) 。 它 是 本 书 的 重点 。 


lan 


第 10 章 介绍 了 一 个 重要 的 优化 手段 一 一 查询 转换 。 这 部 分 相对 来 说 比较 难 ， 相 关 资 料 说 明 较 少 ， 可 作为 重点 来 看 。 


第 11 章 介绍 了 数据 对 象 的 访问 方式 。 这 部 分 也 非常 基础 ， 应 重点 来 看 。 


第 12~16 章 介绍 了 多 种 操作 及 常见 的 优化 手段 ， 包 括 表 关联 、 半 / 反 连 接 、 子 查询 、 排 序 、 并 行 等 。 这 部 分 读者 可 根据 实际 需要 进行 有 重点 的 阅读 。 


实战 篇 是 本 书 的 重点 ， 这 部 分 覆盖 了 常见 优化 的 多 个 方面 。 读 者 可 将 这 部 分 作为 参考 资料 ， 当 需要 时 反复 阅读 。 这 部 分 还 包含 了 大 量 示例 代码 ， 读 者 可 以 通过 实践 反复 体会 。 


本 书 还 提供 了 读者 可 能 感 兴趣 的 拓展 知识 ， 放 在 附录 。 


附录 介绍 了 前 面 各 章节 提 到 的 数据 库 参 数 、 数 据 字典 、 等 待 事件 、 提 示 等 内 容 。 此 外 ， 还 包括 如 何 构造 样 例 数据 ， 方 便 读 者 进行 实际 操作 。 


以 上 是 本 书 各 个 章节 的 安排 情况 和 写作 思路 ， 希 望 有 助 于 读者 阅读 。 


勘误 和 支持 


由 于 笔者 水 平 有 限 ， 加 之 编写 时 间 仓 促 ， 书 中 难免 会 出 现 一 些 错误 或 者 不 准确 的 地 方 ， 尾 请 读者 批评 指正 。 大 家 可 以 通过 邮箱 hanfeng7766@sohu.com 与 我 取得 联系 。 你 可 以 将 书 中 的 错误 和 问题 反 
馈 给 我 ， 我 将 尽量 在 线 上 为 你 提供 最 满意 的 解答 。 期 待 能 够 得 到 你 的 真挚 反馈 。 


致谢 


感谢 每 一 位 帮助 过 我 的 老师 、 同 事 和 领导 ， 是 你 们 让 我 有 了 学 习 和 总 结 的 机 会 。 感 谢 宜 信 公 司 的 各 级 领导 、 同 事 对 我 的 支持 和 鼓励 ， 你 们 的 支持 充分 体现 了 宜 信 开 放 、 分 享 的 企业 文化 。 此 外 ， 也 要 感 
谢 我 的 老 东家 一 一 当当 网 ， 在 那里 我 积累 了 丰富 的 经 验 ， 并 坚定 了 完成 本 书 的 信心 。 


感谢 机 械 工业 出 版 社 华章 公司 的 编辑 孙 海 亮 ， 在 这 一 年 多 的 时 间 中 始终 支持 我 的 写作 。 第 一 次 著 书 写作 ， 过 程 漫长 而 艰辛 ， 正 是 你 的 鼓励 和 帮助 引导 我 顺利 完成 全 部 书稿 。 


感谢 远 在 哈尔滨 的 爸爸 、 妈 妈 和 姐姐 ， 是 你 们 在 艰苦 环境 下 将 我 培养 成 人 ， 并 时 时 刻 刻 为 我 灌输 爱 的 力量 ! 感谢 我 的 岳父 母 ， 是 你 们 承担 了 琐碎 的 家 务 ， 让 我 能 安心 写作 。 最 后 ， 也 是 最 重要 的 ， 一 如 
既往 地 感谢 陪伴 我 左右 的 妻子 和 孩子 ， 你 们 的 爱 和 支持 是 本 书 得 以 完成 的 最 大 动力 。 


说 以 本 书 献 给 我 最 亲爱 的 家 人 和 朋友 ， 以 及 正在 为 自我 实现 而 奋斗 的 、 充 满 朝气 的 IT 工程 师 们 ! 
韩 锋 


第 一 篇 引入 篇 


ol 


“第 0 章 引 


“ 第 1 章 与 5QL 优 化 相关 的 几 个 案例 


第 0 章 引言 


内 


笔者 早年 间 从 事 了 多 年 开发 工作 ， 后 因 个 人 兴趣 转 做 数据 库 。 在 长 期 的 工作 实践 中 ， 看 到 了 数据 库 工作 (特别 是 SQL 优化 ) 面临 的 种 种 问题 ， 同 时 也 发 现 人 们 在 对 数据 库 优化 的 认识 上 存在 一 些 误 


1. 面 临 的 问题 


: 没有 专职 人 员 : 在 很 多 公司 或 者 说 绝 大 多 数 公司 ， 没 有 独立 的 数据 库 团 队 。 往 往 由 开发 人 员 完 成 部 分 DBA 的 职责 ， 包 括 结构 设计 、SQL 优 化 甚至 部 分 运 维 工作 。 受 限于 自身 的 精力 ， 开 发 人 员 很 难 做 


到 专业 化 。 


-““ 赶 工期 ”现象 : 在 项 目 驱动 的 公司 ， 经 常 出 现 赶 工期 的 现象 ， 而 且 往往 牺牲 的 就 是 数据 库 的 设计 、 评 测 、 优 化 的 时 间 。 常 常 只 是 开发 完毕 后 就 匆忙 上 线 ， 直 到 在 线 上 运行 出 现 问题 后 才 会 回头 进行 
处 理 。 但 这 时 往往 已 经 造成 了 很 大 的 损失 。 


: 话语 权 不 大 : 数据 库 团队 在 公司 中 或 者 在 项 目 中 ， 往 往 话语 权 不 高 。 在 很 多 产品 、 项 目 决策 过 程 中 ， 常 常会 忽略 DBA 的 声音 。 


“ 需求 不 明 : 很 多 项 目 在 设计 初期 ， 往 往 对 业务 描述 很 详尽 ， 但 对 数据 库 却 只 字 未 提 。 相 关 数 据 库 的 存储 量 、 访 问 特 征 、 高 峰 时 间 的 TPS 及 QPS 等 往往 只 有 到 上 线 后 才 有 比较 清晰 的 认识 。 其 后 果 就 是 往 
往 需要 大 量 优化 工作 ， 甚 至 导致 需要 对 底层 架构 进行 修改 ， 这 样 最 终 会 导致 成 本 大 大 提高 ， 有 时 增加 的 成 本 甚至 是 不 可 接受 的 。 


“ 重 运 维 、 不 重 架构 设计 : 有 些 公司 认识 到 数据 库 的 重要 性 ， 但 往往 只 重视 运 维 而 忽视 了 前 期 的 架构 设计 、 开 发 优化 等 问题 。 系 统 上 线 后 暴露 出 问题 后 ， 只 能 采取 事后 补救 措施 ， 但 这 往往 会 带 来 高 兄 
的 成 本 。 


盲目 优化 : 有 些 公司 确实 很 重视 SQL 优化 工作 ， 但 又 缺乏 必要 的 技术 投入 。 经 常见 到 这 样 的 开发 规范 一 一 所 有 WHERE 条 件 字段 都 必须 加 上 索引 。 其 结果 就 是 数据 库 被 “过 分 ”优化 ， 适 得 其 反 。 


: 关系 数据 库 已 死 : 近 些 年 来 ， 随 着 NoSQL 的 蓬 描 发 展 ， 有 一 种 观点 也 逐渐 盛行 一 一 关系 数据 库 必 将 死亡 ，NoSQL 将 取而代之 ! 随 之 而 来 的 就 是 SQL 优化 没有 必要 ， 不 必 在 其 上 再 花费 很 大 力气 。 
NoSQL 作 为 一 种 新 兴 的 技术 ， 的 确 有 其 鲜明 的 特点 ， 也 适用 于 一 些 场合 。 但 我 们 要 看 到 ， 很 多 需要 ACID 的 场景 下 ， 传 统 数据 库 仍 然 是 不 二 选择 ， 不 可 取代 。 


“SQL 优化 ”很 简单 : 有 些 人 认为 ，SQL 优 化 很 简单 ， 甚 至 碰 到 过 这 种 观点 一 -SQL 优化 不 就 是 加 几 个 索引 路 ， 有 啥 难 的 ! 其 带 来 的 直接 后 果 就 是 ， 不 重视 这 部 分 工作 。 笔 者 也 确实 在 某 业 务 系 统 
(OLTP) 中 ， 观 察 到 单 表 存在 30 多 个 索引 的 情况 。 也 遇 到 过 ， 因 为 索引 过 多 导致 执行 性 能 出 现 问题 的 情况 。 这 种 情况 ， 往 往 只 有 在 血淋淋 的 事故 后 ， 才 能 引起 领导 的 重视 。 


“ 硬件 技术 发 展 很 快 ， 不 用 再 计较 SQL 优化 : 确实 ， 硬 件 技术 近 些 年 来 发 展 迅速 ， 特 别 是 以 多 核 CPU 为 代表 的 并 行 处 理 技术 和 以 SSD 为 代表 的 存储 技术 。 这 些 新 技术 的 使 用 ， 使 得 服务 器 的 处 理 能 力 有 了 


极 大 的 提升 。 但 我 们 清醒 地 看 到 ，SQL 优 化 才 是 问题 的 根本 解决 之 道 。 我 们 后 面 可 以 看 到 一 条 SQL 语句 ， 可 以 轻易 跑 死 一 个 数据 库 。 这 不 是 简单 地 通过 硬件 升级 就 可 以 解决 的 问题 。 


: SQL 优化 只 是 DBA 的 事情 : 在 很 多 设计 、 开 发 、 测 试 人 员 的 眼中 ，SQL 优 化 只 是 DBA 的 事情 ， 他 们 不 需要 去 关心 。 落 实 到 具体 工作 中 ， 相 关 人 员 就 缺乏 相应 的 优化 意识 ， 只 注重 自身 功能 的 实现 而 忽 
略 了 相应 的 执行 成 本 。 最 终 的 结果 往往 就 是 代码 质量 不 高 ， 上 线 后 问题 过 多 。 


: 数据 仓库 都 使 用 Hadoop， 不 用 传统 关系 型 数据 库 了 : Hadoop 作 为 一 种 新 兴 技 术 ， 被 越 来 越 多 地 用 在 数据 分 析 领 域 。 很 多 国内 外 的 大 型 公司 ， 都 采用 了 这 个 解决 方案 。 但 我 们 清醒 地 看 到 ， 它 的 定位 
更 倾向 于 是 一 种 “离线 数据 分 析 平 台 ”， 而 不 是 “分 布 式 数据 库 ”。 其 时 效 性 、 准 确 性 等 难以 满足 特性 需求 。 现 在 有 很 多 公司 在 Hadoop 上 面 做 了 类 似 “SQL 引 擎 ”的 东西 ， 就 是 仿照 关系 数据 库 的 处 理 方式 
处 理 Hadoop 中 的 数据 ， 但 要 想 达到 发 展 了 数 十 年 的 数据 库 水 平 ， 还 有 很 长 的 路 要 走 。 笔 者 对 这 两 者 的 认识 是 : 各 有 所 长 ， 互 为 补充 。 


第 1 章 ”与 SQL 优化 相关 的 几 个 案例 


案例 1 ”一 条 SQL 引发 的 血案 


1. 案 例 说 明 


某 大 型 电 商 公司 数据 仓库 系统 ， 正 常情 况 下 每 天 凌晨 0~ 9 点 会 执行 大 量 作业 生成 前 一 天 的 业务 报表 ， 供 管理 层 分 析 使 用 。 但 某 天 早晨 6 点 开始 ， 监 控 人 员 就 频繁 收 到 业务 报警 ， 大 批 业务 报表 突然 出 现 大 
面积 延迟 。 原 本 8 点 前 就 应 跑 出 的 报表 ， 一 直 持续 到 10 点 仍然 没有 结果 。 公 司 领 导 非 常 重 视 ， 严 令 在 11 点 前 必须 解决 问题 。 


DBA 紧 急 介 入 处 理 ， 通 过 TOP 命 令 查看 到 某 个 进程 占用 了 大 量 资源 ， 杀 掉 后 不 久 还 会 再 次 出 现 。 经 跟 开 发 人 员 沟 通 ， 这 是 由 于 调度 机 制 所 致 ， 非 正常 结束 的 作业 会 反复 执行 。 暂 时 设置 该 作业 无 效 ， 并 
从 脚本 中 排查 可 疑 SQL。 同 时 对 比 从 线 上 收集 的 ASH/AWR 报 告 ， 最 终 定位 到 某 条 SQL 比 较 可 疑 ， 经 跟 开 发 人 员 确 认 系 一 新 增 功能 ， 因 上 线 紧急 ， 只 做 了 简单 的 功能 测试 。 正 是 因为 这 一 条 SQL， 导 致 整个 系 
统 运行 缓慢 ， 大 量 作业 受到 影响 ， 修 改 SQL 后 系统 恢复 正常 。 


具体 分 析 : 


SELECT /*+ INDEX (Al xxxxx) */ SUM (A2.CRKSL) , SUM (A2.CRKSL*A2.DJ) http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/O0EBPS/Text, 


FROM xxxx A2, xxxx Al 
WHERE A2.CRKFLAG=xxx AND A2.CDATE>=xxx AND A2.CDATE<xxx; 


这 是 一 个 很 典型 的 两 表 关 联 语 句 ， 两 张 表 的 数据 量 都 较 大 。 下 面 来 看 看 执行 计划 ， 如 图 1-1 所 示 。 


执行 计划 触目 惊 心 ， 优 化 器 评估 返回 的 数据 量 为 3505T 条 记录 ， 计 划 返 回 量 127P 字 节 ， 总 成 本 9890G， 返 回 时 间 999: 59: 59。 


ol opeation TwWme Trows]oes [cost ccry] me [sr[rs 
lo SELECTSTATEMENT | | | ssd00 | [| “| 
h_ [sorracoreoare | hh | LU 
lB [| MERGE JOIN CARTESAN | sr fzrp ssoe() essssl | 
lB | PARTTONRANGENERATOR| lzsm foo hrokd) oos412 ss ps 
R | TABLEACCESSFULL Mmesesnsensaitasese|25M [1010M [170K G1) [oo3412 53 |[243 
5 | BUFFERSORT hssM | lss060) la99.59.59 

6 | INDEXFULL SCAN pg |135M | ps2zrk(1) 01:1634| | | 


图 1-1 执行 计划 


分 析 结 论 : 从 执行 计划 中 可 见 ， 两 表 关 联 使 用 了 笛 卡 儿 积 的 关联 方式 。 我 们 知道 笛 卡 儿 连 接 是 指 在 两 表 连 接 没有 任何 连接 条 件 的 情况 。 一 般 情 况 下 应 尽量 避免 竺 卡 儿 积 ， 除 非 某 些 特殊 场合 。 否 则 再 强 
大 的 数据 库 ， 也 无 法 处 理 。 这 是 一 个 典型 的 多 表 关 联 缺 乏 连 接 条 件 ， 导 致 第 卡 儿 积 ， 引 发 性 能 问题 的 案例 。 


2. 给 我 们 的 启示 


从 案例 本 身 来 讲 ， 并 没有 什么 特别 之 处 ， 不 过 是 开发 人 员 朴 忽 ， 导 致 了 一 条 质量 很 差 的 SQL。 但 从 更 深层 次 来 讲 ， 这 个 案例 可 以 给 我 们 带 来 如 下 启示 : 
* 开发 人 员 的 一 个 琉 忽 ， 造 成 了 严重 的 后 果 ， 原 来 数据 库 况 是 如 此 的 脆弱 。 需 要 对 数据 库 保持 一 种 “ 教 晴 ”之 心 。 

: 电脑 不 是 人 脑 ， 它 不 知道 你 的 需求 是 什么 ， 只 能 根据 写 好 的 逻辑 进行 处 理 。 

* 不 要 去 责怪 开发 人 员 ， 谁 都 会 犯错 误 ， 关 键 是 如 何 从 制度 上 保证 不 再 发 生 类 似 的 问题 。 

3. 解 决 之 道 

(1) SQL 开 发 规范 


加 强 对 数据 库 开 发 人 员 的 培训 工作 ， 提 高 其 对 数据 库 的 理解 能 力 和 SQL 开发 水 平 。 将 部 分 SQL 运行 检查 的 职责 前 置 ， 在 开发 阶段 就 能 规避 很 多 问题 。 要 向 开发 人 员 灌 输 SQL 优 化 的 思想 ， 在 工作 中 逐步 积 
累 ， 这 样 才能 提高 公司 整体 开发 质量 ， 也 可 以 避免 很 多 低级 错误 。 


(2) SQL Review 制 度 


对 于 SQL Review， 人 怎么 强调 都 不 过 分 。 从 业内 来 看 ， 很 多 公司 也 都 在 自己 的 开发 流程 中 纳入 了 这 个 环节 ， 甚 至 列 为 考评 范围 ， 对 其 重视 程度 可 见 一 班 。 其 常见 典型 做 法 是 利用 SQL 分 析 引 擎 (商用 或 自 
研 ) 进行 分 析 或 采取 半 人 工 的 方式 进行 审核 。 对 于 审核 后 的 结果 ， 可 作为 持续 改进 的 依据 。SQL Review 的 中 间 结 果 可 以 保留 ， 作 为 系统 上 线 后 的 对 比分 析 依 据 ， 进 而 可 将 SQL 的 审核 、 优 化 、 管 理 等 功能 集 
成 起 来 ， 完 成 对 SQL 整个 生命 周期 的 管理 。 


(3) 限 流 / 资 源 控 制 


有 些 数 据 库 提 供 了 丰富 的 资源 限制 功能 ， 可 以 从 多 个 维度 限制 会 话 对 资源 (CPU、MEMORY、1O) 的 使 用 。 可 避免 发 生 单 个 会 话 影响 整个 数据 库 的 运行 状态 。 对 于 一 些 开 源 数据 库 ， 部 分 技术 实力 较 
强 的 公司 ， 还 通过 对 内 核 的 修改 实现 了 限 流 功 能 ， 控 制 资源 消耗 较 多 的 SQL 运行 数量 ， 从 而 避免 拖 慢 数据 库 的 整体 运行 。 


第 1 章 ”与 SQL 优化 相关 的 几 个 案例 


案例 1 ”一 条 SQL 引发 的 血案 


1. 案 例 说 明 


某 大 型 电 商 公司 数据 仓库 系统 ， 正 常情 况 下 每 天 凌晨 0~ 9 点 会 执行 大 量 作业 生成 前 一 天 的 业务 报表 ， 供 管理 层 分 析 使 用 。 但 某 天 早晨 6 点 开始 ， 监 控 人 员 就 频繁 收 到 业务 报警 ， 大 批 业务 报表 突然 出 现 大 
面积 延迟 。 原 本 8 点 前 就 应 跑 出 的 报表 ， 一 直 持续 到 10 点 仍然 没有 结果 。 公 司 领 导 非 常 重 视 ， 严 令 在 11 点 前 必须 解决 问题 。 


DBA 紧 急 介 入 处 理 ， 通 过 TOP 命 令 查看 到 某 个 进程 占用 了 大 量 资源 ， 杀 掉 后 不 久 还 会 再 次 出 现 。 经 跟 开 发 人 员 沟 通 ， 这 是 由 于 调度 机 制 所 致 ， 非 正常 结束 的 作业 会 反复 执行 。 暂 时 设置 该 作业 无 效 ， 并 
从 脚本 中 排查 可 疑 SQL。 同 时 对 比 从 线 上 收集 的 ASH/AWR 报 告 ， 最 终 定位 到 某 条 SQL 比 较 可 疑 ， 经 跟 开 发 人 员 确 认 系 一 新 增 功能 ， 因 上 线 紧急 ， 只 做 了 简单 的 功能 测试 。 正 是 因为 这 一 条 SQL， 导 致 整个 系 
统 运行 缓慢 ， 大 量 作业 受到 影响 ， 修 改 SQL 后 系统 恢复 正常 。 


具体 分 析 : 


SELECT /*+ INDEX (Al xxxxx) */ SUM (A2.CRKSL) ， SUM (A2.CRKSL*A2.DJ) http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPSVText/ 


FROM xxxx A2, xxxx Al 
WHERE A2.CRKFLAG=xxx AND A2.CDATE>=xxx AND A2.CDATE<xxx; 


这 是 一 个 很 典型 的 两 表 关联 语句 ， 两 张 表 的 数据 量 都 较 大 。 下 面 来 看 看 执行 计划 ， 如 图 1-1 所 示 。 


执行 计划 触目 惊 心 ， 优 化 器 评估 返回 的 数据 量 为 3505T 条 记录 ， 计 划 返 回 量 127P 字 节 ， 总 成 本 9890G， 返 回 时 间 999: 59: 59。 


Dr re ee a ra 3 
lo [SELECT STATEMENT 一 lasg0Gt100) | | 
1 | SORT AGGREGATE | 

NE | [ON— 
B | PARTITION RANGEITERATOR| lzsm [foo hrokd) loo34:12 ss Ps | 
[4 | TABLEACCESSFULL aaeeaseotehthdttgdast |25M [1010M [170K C1) [oo3412 hs3 ps | 


5 | BUFFERSORT | hasm | la890G (1) |a99.59.59|| 


6 | INDEXFULL SCAN pri 135M 382K (1) 01:16:34 


图 1-1 执行 计划 


分 析 结 论 : 从 执行 计划 中 可 见 ， 两 表 关 联 使 用 了 笛 卡 儿 积 的 关联 方式 。 我 们 知道 笛 卡 儿 连 接 是 指 在 两 表 连 接 没有 任何 连接 条 件 的 情况 。 一 般 情 况 下 应 尽量 避免 备 卡 儿 积 ， 除 非 某 些 特殊 场合 。 否 则 再 强 
大 的 数据 库 ， 也 无 法 处 理 。 这 是 一 个 典型 的 多 表 关 联 缺 乏 连 接 条 件 ， 导 致 第 卡 儿 积 ， 引 发 性 能 问题 的 案例 。 


2. 给 我 们 的 启示 


从 案例 本 身 来 讲 ， 并 没有 什么 特别 之 处 ， 不 过 是 开发 人 员 玻 和 忽 ， 导 致 了 一 条 质量 很 差 的 SQL。 但 从 更 深层 次 来 讲 ， 这 个 案例 可 以 给 我 们 带 来 如 下 启示 : 
“ 开发 人 员 的 一 个 琉 忽 ， 造 成 了 严重 的 后 果 ， 原 来 数据 库 竞 是 如 此 的 脆弱 。 需 要 对 数据 库 保持 一 种 “ 襄 展 ”之 心 。 

“ 电脑 不 是 人 脑 ， 它 不 知道 你 的 需求 是 什么 ， 只 能 根据 写 好 的 逻辑 进行 处 理 。 

“ 不 要 去 责怪 开发 人 员 ， 谁 都 会 犯错 误 ， 关 键 是 如 何 从 制度 上 保证 不 再 发 生 类 似 的 问题 。 

3. 解 决 之 道 


(1) SQL 开 发 规范 


加 强 对 数据 库 开 发 人 员 的 培训 工作 ， 提 高 其 对 数据 库 的 理解 能 力 和 SQL 开发 水 平 。 将 部 分 SQL 运行 检查 的 职责 前 置 ， 在 开发 阶段 就 能 规避 很 多 问题 。 要 向 开发 人 员 灌 输 SQL 优 化 的 思想 ， 在 工作 中 逐步 积 
累 ， 这 样 才能 提高 公司 整体 开发 质量 ， 也 可 以 避免 很 多 低级 错误 。 


(2) SQL Review 制 度 


对 于 SQL Review， 人 怎么 强调 都 不 过 分 。 从 业内 来 看 ， 很 多 公司 也 都 在 自己 的 开发 流程 中 纳入 了 这 个 环节 ， 甚 至 列 为 考评 范围 ， 对 其 重视 程度 可 见 一 斑 。 其 常见 典型 做 法 是 利用 SQL 分 析 引擎 (商用 或 自 


研 ) 进行 分 析 或 采取 半 人 工 的 方式 进行 审核 。 对 于 审核 后 的 结果 ， 可 作为 持续 改进 的 依据 。SQL Review 的 中 间 结 果 可 以 保留 ， 作 为 系统 上 线 后 的 对 比分 析 依 据 ， 进 而 可 将 SQL 的 审核 、 优 化 、 管 理 等 功能 
成 起 来 ， 完 成 对 SQL 整个 生命 周期 的 管理 。 


(3) 限 流 / 资 源 控 制 


有 些 数 据 库 提 供 了 丰富 的 资源 限制 功能 ， 可 以 从 多 个 维度 限制 会 话 对 资源 (CPU、MEMORY、1O) 的 使 用 。 可 避免 发 生 单个 会 话 影响 整个 数据 库 的 运行 状态 。 对 于 一 些 开 源 数 据 库 ， 部 分 技术 实力 较 
强 的 公司 ， 还 通过 对 内 核 的 修改 实现 了 限 流 功 能 ， 控 制 资源 消耗 较 多 的 SQL 运行 数量 ， 从 而 避免 拖 慢 数据 库 的 整体 运行 。 


案例 2 糟糕 的 结构 设计 带 来 的 问题 


1. 案 例 说 明 


这 是 某 公司 后 台 的 ERP 系 统 ， 系 统 已 经 上 线 运行 了 10 多 年 。 随 着 时 间 的 推移 ， 累 积 的 数据 量 越 来 越 大 。 随 着 公司 业务 量 的 不 断 增加 ， 数 据 库 系统 运行 缓慢 的 问题 日 益 凸显 。 为 提高 运行 效率 ， 公 司 计划 
有 针对 性 地 对 部 分 大 表 进 行 数据 清理 。 在 DBA 对 某 个 大 表 进 行 清理 时 出 现 了 问题 。 这 个 表 本 身 有 数 百 GB， 按 照 指 定 的 清理 规则 只 需要 根据 主键 字段 范围 (运算 符 为 >=) 选择 出 一 定 比例 (不 超过 10%) 的 
数据 进行 清理 即 可 。 但 在 实际 使 用 中 发 现 ， 该 SQL 是 全 表 扫 描 ， 执 行 时 间 大 大 超出 预期 时 间 。DBA 举 试 使 用 强制 指定 索引 方式 清理 数据 ， 依 然 无 效 ， 整 个 SQL 语句 的 执行 效率 达 不 到 要 求 。 为 了 避免 影响 正 
常 业务 运行 ， 不 得 不 将 此 次 清理 工作 放 在 半夜 进行 ， 还 需要 协调 库房 等 诸多 单位 进行 配合 ， 严 重 影响 正常 业务 运行 。 


为 了 尽量 减少 对 业务 的 影响 ，DBA 求 助 笔者 帮助 协同 分 析 。 这 套 ERP 系 统 是 由 第 三 方 公司 开发 的 ， 历 史 很 久远 ， 相 关 的 数据 字典 等 信息 都 已 经 找 不 到 了 ， 只 能 从 纯 数 据 库 的 角度 进行 分 析 。 这 是 一 个 普 
通 表 ( 非 分 区 表 ) ， 按 照 主键 字段 的 范围 查询 一 批 记 录 并 进行 清理 。 按 照 正 常理 解 ， 执 行 索引 范围 扫描 应 该 是 效率 较 高 的 一 种 处 理 方式 ， 但 实际 情况 都 是 全 表 扫 描 。 进 一 步 分 析 发 现 ， 该 表 的 主键 是 没有 业 
务 含义 的 ， 仅 仅 是 自 增长 的 数据 ， 其 来 源 是 一 个 序列 。 但 奇怪 的 是 ， 这 个 主键 字段 的 类 型 是 变 长 文本 类 型 ， 而 不 是 通常 的 数字 类 型 。 当 初 定义 该 字段 类 型 的 依据 ， 现 在 已 经 无 从 考证 ， 但 实验 表明 正 是 这 个 
字段 的 类 型 “异常 ”， 导 致 了 错误 的 执行 路 径 。 


下 面 通过 一 个 实验 重 现 这 个 问题 。 


(1) 数据 准备 


两 个 表 的 数据 类 型 相似 (只 是 1D 字段 类 型 不 同 ) ， 各 插入 了 320 万 数据 ，ID 字 段 范围 为 1~3200000。 


create table tl as select * from dba _ objects where 1=0; 

alter table tl add id int primary key; 

create table t2 as select * from dba objects where 1=0; 

alter table t2 add id varchar2 (10) Pprimary key; 

insert into tl1 

select 'test', 'test', 'test', rownum, rownum, 'test', sysdate, sysdate, 'test', 'test', '', '', '', rownum 
from dual 

connect by rownum<=3200000; 

insert into t2 


select 'test', 'test', 'test', rownum, rownum, 'test', sysdate, sysdate, 'test', 'test', '', '', '', rownum 
from dual 

connect by rownum<=3200000; 

Commit; 


execdbms_stats.gather table stats (ownname => 'hf', tabname => 't1l', cascade =>true, estimate percent => 100) ; 
execdbms_stats.gather table stats (ownname => 'hf', tabname => 't2', cascade =>true, estimate percent => 100) ; 


(2) 模拟 场景 


相关 代码 如 下 : 


select * from tl where id>= 3199990; 
11 rows selected. 


| Id | Operation | Name IRows |Bytes|lCost (%CPU) | Time | 
| 0 | SELECT STATEMENT | ll 1 693 1 4 (0) | 00: 00: 01 | 
| 1 | TABLE ACCESS BY INDEX ROWID| T1 1-1. .883 1 4 (0) 1 00: 00: 01 | 
I* 2 | INDEX RANGE SCAN 1SYS_C00252941 11 | | 3 (0) | 00: 00: 01 | 


recursive calls 
db block gets 

consistent gets 
physical reads 


对 于 普通 的 采用 数值 类 型 的 字段 ， 范 围 查询 就 是 正常 的 索引 范围 扫描 ， 执 行 效率 很 高 。 


select * from t2 where id>= '3199990'; 
755565 rows selected. 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT | | 2417K| 149M| 8927 (2) | 00: 01: 48 | 
I* 1 | TABLE ACCESS FULL| T2 | 2417K| 149M| 8927 (2) | 00: 01: 48 | 
Statistics 


1 recursive calls 

0 db block gets 

82568 consistent gets 
0 physical reads 


对 于 文本 类 型 字段 的 表 ， 范 围 查询 就 是 对 应 的 全 表 扫 描 ， 效 率 较 低 是 显而易见 的 。 


(3) 分 析 结 论 
“ 字符 类 型 在 索引 中 是 “ 乱 序 ”的 ， 这 是 因为 字符 类 型 的 排序 方式 与 我 们 的 预期 不 同 。 从 “select*from t2 where id>='3199990'” 执 行 返回 755565 条 记录 可 见 ， 不 是 直观 上 的 10 条 记录 。 这 也 是 当初 在 做 表 


设计 时 ， 开 发 人 员 没 有 注意 的 问题 。 


“ 字符 类 型 还 导致 了 聚 答 因 子 很 大 ， 原 因 是 插入 顺序 与 排序 顺序 不 同 。 详 细 点 说 ， 就 是 按照 数字 类 型 插入 〈1http://www.hzcourse.comyresource/readBook? 
path=/openresources/teach_ebook/uncompressed/15654/OEBPS/Text/..3200000) ， 按 字符 类 型 ("1'http://www.hzcourse.com/resource/readBook? 


path=/openresources/teach_ebook/uncompressed/15654/OEBPS/Text/..…32000000') t 排 序 。 


selecttable name, index name, leaf blocks, num rows, clustering factor 
fromuser indexes 
wheretable name in ('T1', 'T2'); 


TABLE NAME INDEX NAME LEAF BLOCKS NUM ROWS CLUSTERING FACTOR 
T1 SYS_C0025294 6275 3200000 31520 
T2 SYS_C0025295 13271 3200000 632615 


“ 在 对 字符 类 型 使 用 大 于 运算 符 时 ， 会 导致 优化 器 认为 需要 扫描 索引 大 部 分 数据 且 聚 丛 因 子 很 大 ， 最 终 导 致 齐 用 索引 扫描 而 改 用 全 表 扫 描 方式 。 


(4) 解决 方法 


具体 的 解决 方法 如 下 : 


select * from t2 where id between '3199990' and '3200000'; 


| Id | Operation | Name 1Rows1Bytes |Cost (SCPU) | Time | 


| 0 | SELECT STATEMENT | | 6| 390 | 5 (0) 100: 00: 011 

| 1 | TABLE ACCESS BY INDEX ROWID| T2 | 6| 390 | § 0 100: 00: O11 
[| INDEX RANGE SCAN | SYS_C0025295 | 6| 1 3 (0) 100: 00: 011 
Statistics 


1 recursive calls 
0 db block gets 
13 consistent gets 
0 physical reads 


将 SQL 语 句 由 开放 区 间 扫 描 (>=) ， 修 改 为 封闭 区 间 (between xxx and max_value) 。 使 得 数据 在 索引 局 部 顺序 是 “对 的 ”。 如 果 采 用 这 种 方式 仍然 走 索 引 扫 描 ， 还 可 以 进一步 细 化 分 段 或 者 采 
“逐条 提取 + 批 绑 定 ”的 方法 。 


2. 给 我 们 的 启示 
这 是 一 个 典型 的 由 不 好 的 数据 类 型 带 来 的 执行 计划 异常 的 例子 。 它 给 我 们 带 来 如 下 启示 : 
“ 禄 粒 的 数据 结构 设计 往往 是 致命 的 ， 后 期 的 优化 只 是 补救 措施 。 如 果 从 源头 上 加 以 杜绝 ， 这 才 是 优化 的 根本 。 


“ 在 设计 初期 能 引入 数据 库 审核 ， 可 以 起 到 很 好 的 作用 。 


案例 3 ”规范 SQL 写法 好 处 多 


1. 案 例 说 明 


某 大 型 电 商 公司 数据 仓库 系统 ， 开 发 人 员 反 映 作业 运行 缓慢 。 经 检查 是 一 个 新 增 业务 中 某 条 SQL 语句 导致 。 经 分 析 是 非 标准 的 SQL 引起 优化 器 判断 异常 ， 将 其 修改 成 标准 写法 后 ，SQL 恢 复 正 常 。 


(1) 具体 分 析 


看 下 面 的 代码 : 


select http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... from http://www.hzcourse.com/resource/readBook?path=/openresc 
where ( 
( order creation date>= to date (20120208, 'yyyy-mm-dd') and 
order creation date<to date (20120209, 'yyyy-mm-dd') 


or 
( send date>= to date (20120208, 'yyyy-mm-dd') and send date<to date (20120209, 'yyyy-mm-dd') 
4 

andqnvl (a.bd id, 0) 1 


Id Operation | Name |Cost (%CPU) | Time |Pstart | Pstop | 
0 SELECT STATEMENT 1 | 2470K (100) | | | | 
1 SORT GROUP BY 1 | | | | | 
2 TABLE ACCESS BY GLOBAL INDEX ROWID 
| XXXX | 5 (0) | 00: 00: 01 | ROW IL | ROWL | 
3 NESTED LOOPS 2470K (1) 08: 14: 11 
4 VIEW IVW_ NSO 1| 2470K (1) | 08: 14: 10 | | | 
5 FILTER | 一 1 | | | | 
6 HASH GROUP BY | | 2470K (1) | 08: 14: 10 | | l: 
7 TABLE ACCESS BY GLOBAL INDEX ROWID 
| XXXX | 5 (0) | 00: 00: 01 | ROW L | ROW LIL | 
8 NESTED LOOPS 2470K (1) 08: 14: 10 
9 SORT UNIQUE 2340K (2) | 07: 48: 11 
10 PARTITION RANGE ALL 
2340K (2) | 07: 48: 11 1 92 
11 TABLE ACCESS FULL 
XXXX 2340K (2) | 07: 48: 11 让 92 
12 INDEX RANGE SCAN 
XXXX 3 (0) | 00: 
13 INDEX RANGE SCAN XXXX 3 (0) 00 
这 个 SQL 中 涉及 的 主要 表 是 一 个 分 区 表 ， 从 执行 计划 (Pstart、Pstop) 中 可 见 , 扫描 了 所 有 分 区 ， 分 区 裁剪 特性 没有 起 效 。 


(2) 解决 方法 


见 下 面 的 代码 : 


select http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 
from http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 
where 

order creation date >= to date (20120208, 'yyyy-mm-dd') and 

order creation date<to date (20120209, 'yyyy-mm-dd') 
union all 本 本 
select http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 
from http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/... 
where 
send date>= to date (20120208, 'yyyy-mm-dd') and 

send date<to date (20120209, 'yyyy-mm-dd') and 
nvl (a.bd id, 0) = 5 


尝试 通过 引入 union all 来 分 解 查询 ， 以 便于 优化 器 做 出 更 准确 的 判断 。 采 用 这 个 方法 后 ， 确 实 起 效 了 ， 当 然 不 可 避免 会 扫描 两 遍 表 。 


select http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPSVText/... 
from http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 
where ( 
( 
order creation date>= to date (20120208, 'yyyymm9d') and 
order creation date<to date (20120209,'yyyynrmgd') 


or 
( 
send date>= to date (20120208, 'yyyymm9d') and 
send date<to date (20120209,'yyyymm9d') 
六 
| Id | Operation | Name | Cost (%CPU) |Time | Pstart | Pstop | 
| 0 | SELECT STATEMENT | | 42358 (1) | 00: 08: 29 | | | 
| 1 | SORT AGGREGATE | | | | | | 
| 2 | CONCATENATION | | | | | 
| 3 PARTITION RANGE SINGLE 


| li T7393 (13 1 00: 3 23: 1 | 7 
| 过 4 1 TABLE ACCESS FULL 


| XXX | 17393 (1) | 00: 03: 29 1 | | 


性 5 | TABLE ACCESS BY GLOBAL INDEX ROWID 

| XXXX | 24966 (1) | 00: 05: 00 | ROWID | ROWID | 
使 6 1 INDEX RANGE SCAN 

| XXXX | 658 (1) | 00: 00: 08 | | | 


通过 调整 日 期 FORMAT 格 式 ， 优 化 器 很 精准 地 判断 了 分 区 (Pstart=57 Pstop=57) ， 整 体 SQL 性 能 得 到 了 很 大 的 提高 。 作 业 运 行 时 间 从 8 个 多 小 时 ， 缩 减 到 8 分 钟 。 


(3) 分 析 结 论 


对 于 非 标 准 的 日 期 格式 ，Oracle 在 复杂 钦 辑 判断 的 情况 下 分 区 裁剪 特性 无 法 识别 ， 不 起 作用 。 这 种 情况 下 ， 会 走 全 表 扫 描 ， 结 果 是 正确 的 ， 但 是 执行 效率 会 很 低 。 通 过 使 用 union all， 简 化 了 条 件 判 
断 。 使 得 Oracle 在 非 保 准 日 期 格式 下 也 能 使 用 分 区 裁剪 特性 ， 但 最 佳 修改 方式 还 是 规范 SQL 的 写法 。 


2. 给 我 们 的 启示 
: 规范 的 SQL 写法 ， 不 但 利于 提高 代码 可 读 性 ， 还 有 利于 优化 器 生成 更 优 的 执行 计划 。 


: 分 区 功能 是 Oracle 应 对 大 数据 的 利器 ， 但 在 使 用 中 要 注意 是 否 真正 会 用 到 分 区 特性 ; 否则 ， 可 能 适得其反 ， 使 用 分 区 会 导致 效率 更 差 。 


案例 4 “月 底 难 过 


1. 案 例 说 明 


某 大 型 电 商 公司 数据 仓库 系统 经 常 出 现在 月 底 运 行 缓慢 的 情况 ， 但 在 平时 系统 运行 却 非常 正常 。 这 是 因为 月 底 往 往 有 月 报 等 大 批量 作业 运行 ， 而 就 在 这 个 时 间 点 上 ， 常 常会 出 现 缓慢 情况 ， 因 此 业务 人 
员 一 到 月 底 就 非常 紧张 。 这 也 成 了 一 个 老大 难 问题 ， 困 扰 了 很 长 时 间 。 


DBA 介 入 处 理 ， 发 现 一 个 很 奇怪 的 现象 : 某 条 主要 SQL 是 造成 执行 缓慢 的 主因 ， 其 执行 计划 是 不 确定 的 ， 也 就 是 说 因为 执行 计划 的 改变 ， 导 致 其 运行 效率 不 同 。 而 往往 较 差 的 执行 计划 发 生 在 月 底 几 
天 ， 且 由 于 月 底 大 批 作业 的 影响 ， 整 体 性 能 比较 饱和 ， 更 突显 了 这 个 问题 。 针 对 某 个 出 现 问题 的 时 间 段 ， 做 了 进一步 分 析 ， 结 果 表 明 是 由 于 统计 信息 的 缺失 导致 了 优化 器 产生 了 较 差 的 执行 计划 ， 并 据 此 指 
定 了 人 工 策略 ,彻底 解决 了 这 个 问题 。 


(1) 具体 分 析 


先 来 看 下 面 的 代码 : 


selecthttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPSVText/.. 
from xxx a join xxx b on a.order id = b.lyywzdid 
left join xxx c on b. gysid > gysid 


whereb.cdate>= to date ('2012-03-31', 'yyyy-mm-dd') — 3 and http://www.hzcourse. Com/ resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/.. 
a.send date>= to date ('2012-03-31', ‘yyyy-mm-dd') - 1 and a.send date<to date ('2012-03-31', "yyyy-mmdd') ; 
Id Operation Name Rows Bytes Cost (%CPU) Pstart |Pstop| 
0 SELECT STATEMENT 4 104 9743 (1) | 
1 HASH JOIN OUTER 104 9743 (1) | 
2 TABLE ACCESS BY LOCAL INDEX on 
XXXX 22 0 (0) 1189 11891 
3 NESTED LOOPS 94 9739 (1) | 
4 PARTITION RANGE ITERATOR 
1032 74304 9739 (1) 123 518 | 
3 TABLE ACCESS FULL 
XXXX 1032 74304 9739 (1) 123 518 | 
6 PARTITION RANGE SINGLE 
1 0 (0) 1189 1189 | 
? INDEX RANGE SCAN 
XXXX . 0 (0) 1189 1189 | 
8 TABLE ACCESS FULL 
XXXX 183 1830 3 (0) | 


执行 计划 中 ， 多 表 关 联 私 用 了 赃 套 循环 ， 这 点 对 于 OLAP 系 统 来 说 是 比较 少见 的 。 一 般 优化 器 更 倾向 于 使 用 SM 和 HJ。 进 一 步 检 查 发 现 其 成 本 竟然 是 0， 怪 不 得 优化 器 使 用 了 嵌 套 循环 。 


(2) 深入 分 析 


检查 发 现 索引 数据 统计 信息 异常 ， 这 是 分 区 索引 ， 仅 两 天 的 分 区 统计 信息 都 是 9。 导 致 优化 器 认为 谋 套 循环 的 执行 效率 更 高 ， 而 不 是 使 用 哈 希 连接 。 结 合 业务 发 现 ， 月 底 是 业务 高 峰 期 ， 对 于 系统 统计 信 
息 的 作业 收集 ， 在 指定 的 时 间 窗 口内 无 法 完成 。 最 后 导致 统计 信息 不 完整 ， 优 化 器 采用 了 错误 的 执行 计划 。 


(3) 解决 方法 


解决 的 代码 如 下 : 


exec dbms_stats.gather index stats ( 
ownname=>' xxx' , 
indname=>'xxx' , 
partname=>'PART xxx', 
estimate percent => 10) ; 


分 析 完 对 象 的 统计 信息 即 恢复 正常 。 


2. 给 我 们 的 启示 


“ 统计 信息 是 优化 器 优化 的 重要 参考 依据 ， 一 个 完整 、 准 确 的 统计 信息 是 必要 条 件 。 往 往 在 优化 过 程 中 ， 第 一 步 就 是 查看 相关 对 象 的 统计 信息 。 


“ 分 区 机 制 是 Oracle 针 对 大 数据 的 重要 解决 手段 ， 但 其 也 很 容易 造成 所 谓 “ 放 大 效应 ”。 即 对 于 普通 表 而 言 ， 统 计 信息 更 新 不 及 时 可 能 不 会 导致 执行 计划 偏差 过 大 ; 但 对 于 分 区 表 、 索 引 来 说 ， 很 容易 出 
现 因 更 新 不 及 时 出 现 0 的 情况 ， 进 而 导致 执行 计划 产生 严重 偏差 。 


案例 5 COUNT (*) 到 底 能 有 多 快 


1. 案 例 说 明 


一 个 大 表 的 COUNT， 究 竟 能 有 多 快 ? 除 类 似 物 化 视图 的 做 法 ,我 们 所 能 做 到 的 极限 能 有 多 快 ? 这 不 是 一 个 真实 的 案例 ， 而 是 根据 笔者 在 网 上 发 的 一 篇 帖子 整理 而 来 。 通 过 对 一 条 SQL， 采 用 多 种 方式 持 
续 优化 过 程 ， 表 明 SQL 优 化 的 手段 随 着 优化 者 掌握 的 技能 增多 ， 其 可 能 存在 的 手段 也 在 不 断 增多 。 


(1) 数据 准备 


数据 准备 的 代码 如 下 : 


create table t2 select * from dba objects; 
insert into t2 select * from t2; 
http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/O0EBPS/Text/... 


select count (*) from t2; =>102400000 一 -数据 量 有 1 亿 多 条 
select bytes/1024/1024 from user_ segments where segment name='T2'; => 10972 一 -数据 对 象 大 小 有 10 多 GB 
(2) 全 表 扫 描 


全 表 扫 描 的 代码 如 下 (共用 124 秒 ， 好 慢 呀 ) : 


select count (*) from t2; 
Elapsed: 00: 02: 04.09 


| Id | Operation | Name | Rows | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT | | 11 381K (1) | 01: 16: 19 | 
| 1 | SORT AGGREGATE | | | | | 

| 信人 TABLE ACCESS FULL| T2 | 102M| 381K C1 | OL: 16: 19 1 
Statistics 


1 recursive calls 

0 db block gets 

1400379 consistent gets 
1068862 physical reads 


由 上 可 知 ， 全 表 扫 描 耗 时 较 长 。 


(3) 主键 索引 


主键 索引 的 代码 如 下 : 


alter table t2 add constraint pk t2 primary key (id) ; 

execdbms_ stats.gather index stats ('hf', 'pk t2', estimate percent =>10) ; 
select count (*) from t2; 

Elapsed: 00: 00: 33.18 


0 | SELECT STATEMENT 4 l 1 | 64271 C2} | O00 T2521 
| 1 | SORT AGGREGATE | i 11 | | 
| INDEX FAST FULL SCAN| PK T2 | 102M| 64271 (2 | ‘00% 12: 52 | 


1 recursive calls 

0 db block gets 

228654 consistent gets 
205137 physical reads 


通过 引入 索引 ， 执 行 计划 变 成 索引 快速 全 扫描 ， 因 扫描 块 数 较 少 ， 因 此 耗 时 也 大 大 减少 ， 共 用 33 秒 ， 快 多 了 。 


(4) 常数 索引 


常数 索引 的 代码 如 下 : 


create index idx 0 on t2 (0) ; 

execdbms stats.gather index stats ('hf', 'idx 0', estimate percent =>10) ; 
select count (*) from t2; 加 ee 

Elapsed: 00: 00: 28.92 


0 | SELECT STATEMENT . | 1 | 49601 (2) 1 00: 09: 56 | 
| 1 | SORT AGGREGATE | | | 1 | 
| INDEX FAST FULL SCAN| IDX 0 | 102M| 49601 (2) | 00: 09: 56 | 


1 recursive calls 

0 db block gets 

185899 consistent gets 
167726 physical reads 


常数 索引 在 存储 密度 上 要 高 于 普通 字段 索引 ， 因 此 扫描 块 数 更 少 ， 耗 时 也 更 少 ， 共 耗 时 29 秒 。 


(5) 常数 压缩 索引 


常数 压缩 索引 的 代码 如 下 : 


Create index idx 0 on t2 (0) compress; 

execdbms_stats.gather index stats ('hf', 'idx 0', estimate percent =>10) ; 
select count (*) from t2; 

Elapsed: 00: 00: 27.85 


| Id | Operation | Name | Rows | Cost (%CPU) | Time | 
0 | SELECT STATEMENT | 1 | 43812 (3) | 00: 08: 46 | 

| 1 | SORT AGGREGATE ! | 二 1 1 | 
21 | 102M| 43812 (3) | 00: 08: 46 | 


1 recursive calls 
0 db block gets 

157636 consistent gets // 压 缩 后 ， 减 少 了 
141651 physical reads 


索引 压缩 进一步 减少 了 扫描 规模 ， 耗 时 缩减 到 27 秒 。 


(6) 位 图 索引 


位 图 索引 的 代码 如 下 : 


[ 


Create bitmap index idx status2 on t2 (status) ; 

execdbms stats.gather index stats 《RE 'idx status2', estimate percent=> T1033 
select count (*) from t2; 

Elapsed: 00: 00: 00.9 


| Id | Operation | Name | Rows | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT 1 1 1 | 2262 《yy L000 28 1 
| 1 | SORT AGGREGATE | 1 | 

| 艺 |] BITMAP CONVERSION COUNT 


| 102M | 2262 (1) | 00: 00: 28 | 
| | BITMAP INDEX FAST FULL SCAN 
| IDX_STRATUS2 | | | 1 


1 recursive calls 
0 db block gets 

2502 consistent gets // 大 大 减少 
351 physical reads 


网 


索引 不 同 于 B 树 索引 ， 其 存储 密度 更 高 。 这 里 是 采用 status 字 段 ， 如 果 使 用 常数 索引 ， 


规模 将 更 小 。 这 种 手段 用 时 0.9 秒 ， 这 是 质 的 飞跃 。 


位 


网 


(7) 位 图 索引 + 并 行 


alter index idx status2 Parallel 8; 
select count (*) from 七 2; 
Elapsed: 00: 00: 00.03 


3 Operation Name |Rows TQ |IN-OUT|PQ Distribl 
0 SELECT STATEMENT | 下 人 271 | | | 
让 SORT AGGREGATE | 1 | | | 1 
2 PX COORDINATOR | | | | 
3 PX SEND QC (RANDOM) 
: TQ10000 | 浅川 IQ1, 00| P->S | QC (RAND) | 
4 SORT AGGREGATE 
| 1 Q1, 00| PCWP | | 
5 PX BLOCK ITERATOR 
| 102M|00: 00: 27|Q1, 00| PCWC | | 
6 BITMAP CONVERSION COUNT 
| 102M|00: 00: 27|Q1, 00| PCWP | | 
思 BITMAP INDEX FAST FULL SCAN 
IDX STATUS2 | Q1, 00| PCWP | | 


265 recursive calls 
3 db block gets 
3059 consistent gets 
0 physical reads 


并 行 技术 可 以 较 快 执行 速度 。 一 致 性 读 有 所 增加 ， 但 并 行 还 是 能 加 快 整体 运行 速度 ， 这 种 手段 耗 时 0.03 秒 ， 竟 然 又 快 了 不 少 。 


(8) 分 析 结 论 


“ 位 图 索引 可 以 按 很 高 密度 存储 数据 ， 因 此 往往 比 B 树 索引 小 很 多 。 前 提 是 在 基数 比较 小 的 情况 下 。 


廊 
网 


索引 是 保存 空 值 的 ， 因 此 可 以 在 COUNT 中 利用 。 


“ 众所周知 ， 位 图 索引 不 太 适 合 OLTP 类 型 数据 库 。 该 实例 仅 为 了 测试 展示 。 


2. 给 我 们 的 启示 


优化 没有 止境 ， 对 数据 库 了 解 越 多 ， 你 能 想到 的 方法 就 越 多 。 


案例 6 “ 抽 丝 剥 昔 ” 找 出 问题 所 在 


1. 案 例 说 明 


这 个 案例 本 身 不 是 为 了 说 明 某 种 技术 ， 而 是 展现 DBA 在 分 析 处 理 问题 时 的 一 种 处 理 方式 。 其 采用 的 方法 往往 是 根据 自己 掌握 的 知识 ， 分 析 判 断 某 种 可 能 性 ， 然 后 再 验证 是 否 是 这 个 原因 。 在 不 断 地 抛 出 
疑问 ， 不 断 地 验证 纠 错 中 ， 逐 步 接近 问题 的 本 质 。 


这 是 某 数据 仓库 系统 ， 有 一 个 作业 在 某 天 出 现 较 大 延迟 。 原 来 作业 只 需要 运行 10 几 分 钟 ， 现 在 需要 运行 2 个 多 小 时 ， 这 是 业务 不 能 接受 的 。 为 了 不 影响 明天 的 业务 系统 ， 必 须 在 今天 解决 这 个 问题 。 经 
和 开发 人 员 的 沟通 ， 该 业务 的 SQL 语句 没有 修改 ， 相 关 的 数据 结构 也 没有 变更 相 类 似 的 其 他 业务 (SQL 语句 相似 的 ) 也 都 正常 运行 ， 数 据 库 系统 本 身 也 没有 异常 。 


在 排除 了 诸多 异常 后 ， 这 个 问题 似乎 变 得 很 琼 手 ， 原 本 运行 正常 的 SQL 语句 ， 忽 然 在 某 一 天 变 得 异常 缓慢 。 针 对 这 个 问题 ， 我 采取 步步为营 的 策略 ， 逐 步 排除 可 能 的 原因 ， 并 最 终 找到 问题 本 质 ， 圆 满 
地 解决 了 该 问题 。 


看 下 面 的 代码 : 


INSERT INTO xxx 
SELECT http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/... 
FROM http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 


LEFT JOIN tl a ON t.product id = a.product id AND http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 
LEFT JOIN t2 b ON t.product id = b.product_ id AND http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/... 
LEFT JOIN t3 c ON t.product id = c.product id AND http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 
LEFT JOIN t4 d ON t.product id = d.spxxid AND http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 
LEFT JOIN t5 e ON t.product jd = e.spxxid AND http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 
LEFT JOIN t6 f ON t.product id = f.spxxid AND http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 
LEFT JOIN t7 g ON 七 .product jd = g.spxxid AND http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 
LEFT JOIN t8 h ON t.product id = h.product idAND http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 
LEFT JOIN t9 I ON t.product id = i.prod id 

LEFT JOIN t10 j ON t.product id = j.prod id AND http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/... 
LEFT JOIN tl11 k ON t.product id = k.prod id AND http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/,.. 
LEFT JOIN t12 1 ON t.product id = 1.prod id AND http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 
LEFT JOIN t13 m ON t.product id = m.prod id AND http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/... 
LEFT JOIN t14 o ON t.product id = o.product id; 


这 是 一 个 多 达 15 个 表 的 关联 查询 (非常 佩服 开发 人 员 ， 逻 辑 思维 太 强 了 ) 。 查 询 的 结果 集 有 400 多 万 条 ， 并 插入 目标 表 中 。 其 中 目标 表 较 大 ， 有 7 亿 多 条 记录 ， 物 理 大 小 为 380GB。 在 之 前 的 运行 过 程 
中 ， 用 时 十 几 分 钟 。 


第 一 步 猜 测 一 一 执行 计划 异常 导致 的 问题 ? (固化 执行 计划 ) 


最 开始 想到 的 方法 很 简单 ， 既 然 类 似 的 SQL 执行 效率 没 问题 ， 而 这 个 SQL 由 于 其 他 SQL 执行 计划 偏差 较 大 ， 可 以 手工 采取 固化 执行 计划 的 方法 。 这 里 使 用 了 抽取 OUTLINE 的 方式 ， 具 体 方法 可 参见 后 画 
的 内 容 。 
其 调整 后 的 执行 计划 如 下 ， 跟 其 他 类 似 SQL 的 执行 计划 相同 。 整 个 执行 计划 基本 可 概括 为 “HASH JOIN” + “FULL TABLE SCAN” 。 
INSERT INTO RPT PROD DAY 
SELECT CR， 
eh 
http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 
http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 
FULL (@"SEL$30069D69" "I"@"SEL$19") 
FULL (@"SEL$30069D69" "“F"@"SELS$13") 
http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 
LEADING (@"SEL$30069D69" "SEL$4" http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 
USE HASH (@"SEL$30069D69" @"SELS$1") 
USE_ HASH (@"SEL$30069D69" @"SELS$21") 
USE HASH (@"SEL$30069D69" "I"@"SEL$19") 
http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 
http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/... 
采用 上 述 方 式 处 理 后 ， 整 体 运 行 时 长 减少 了 10 多 分 钟 ， 但 仍然 超过 了 2 个 小 时 。 显 然 ， 对 执行 计划 异常 的 判断 ， 不 是 问题 的 主因 。 
第 二 步 猜 测 一 一 缓存 的 的 鬼 ? 
进一步 检查 发 现 ， 在 执行 过 程 中 发 现 了 大 量 的 “db file sequential read” 等 待 事件 。 这 个 不 太 寻 常 。 一 般 情况 下 ， 全 表 扫 描 会 产生 “db file scattered read” 等 待 事件 。 产 生 后 者 的 原因 通常 是 在 
buffer 中 缓存 了 大 部 分 数据 ， 优 化 器 才 可 能 决定 不 使 用 顺序 读 的 方式 从 文件 中 读 取 数据 。 因 此 数据 库 版 本 是 10g， 不 能 直接 干预 全 表 扫 描 是 从 缓冲 区 中 读 取 还 是 文件 中 读 取 (11g 是 可 以 的 ) ， 只 能 采取 其 他 


方式 。 建 议 更 换 相 关 作业 执行 顺序 ， 避 免 缓冲 区 干扰 。 经 测试 ， 速 度 还 是 没有 明显 提升 。 第 二 步 猜 测 失败 。 


第 三 步 猜 测 一 一 究竟 是 哪个 对 象 导致 的 ? 


进一步 分 析 SQL 执 行 时 的 情况 ， 发 现 忽略 了 一 个 关键 信息 ， 那 就 是 产生 “db file sequential read” 等 待 事件 的 对 象 。 人 们 往往 想当然 地 认为 全 表 扫 描 是 表 ， 经 检查 后 发 现 其 是 一 个 索引 ， 而 且 这 个 索引 
是 目标 表 的 全 局 索引 ， 相 关 聚 篮 因 子 非常 大 ， 接 近 表 的 行 数 。 在 插入 的 过 程 中 ， 需 要 大 量 维护 索引 成 本 。 此 表 本 身 还 有 另外 两 个 索引 ， 都 是 本 地 分 区 索引 ， 维 护 成 本 很 低 。 


跟 开 发 人 员 沟通 后 ， 该 索引 是 前 一 天 临时 加 入 的 ， 且 没有 通过 DBA 审 核 。 开 发 人 员 个 人 觉得 全 局 索引 效率 较 高 ， 因 此 就 建成 了 全 局 的 。 后 续 将 此 索引 修改 为 本 地 分 区 索引 。 经 测试 ， 速 度 从 2 个 多 小 时 缩 
减 到 12 分 钟 ， 问 题 得 到 解决 。 


2. 给 我 们 的 启示 
“ 优化 SQL 就 是 一 个 抽 丝 剥 茧 找到 问题 本 质 的 过 程 。 在 不 断 猜测 、 不 断 试 错 的 过 程 中 ， 逐 步 接近 事件 的 本 质 。 你 所 掌握 的 知识 点 越 多 ， 可 “猜测 ”的 可 能 性 就 越 多。 


“ 数据 结构 的 变更 要 经 过 DBA 的 审核 ， 这 样 可 以 避免 很 多 问题 ， 也 可 以 尽早 发 现 问题 、 解 决 问题 。 


第 二 篇 “原理 篇 


“ 第 2 章 ”优化 器 与 成 本 
“第 3 章 ”执行 计划 

“第 4 章 ”统计 信息 

“第 5 章 ”SQL 解析 与 游标 
“第 6 章 绑 定 变量 

: 第 7 章 SQL 优化 相关 对 象 

: 第 8 章 SQL 优化 相关 存储 结构 


“ 第 9 章 ”特有 SQL 


第 2 章 “优化 器 与 成 本 


优化 器 是 数据 库 最 核心 的 功能 ， 也 是 最 复杂 的 一 部 分 。 它 负责 将 用 户 提交 的 SQL 语句 根据 各 种 判断 标准 ， 制 定 出 最 优 的 执行 计划 ， 并 交 由 执行 器 来 最 终 执行 。 优 化 器 算法 的 好 坏 、 能 力 的 强 弱 ， 直 接 决 
定 了 语句 的 执行 效率 。 笔 者 也 使 用 了 其 他 诸如 MySQL、PostgreSQL、SQLserver 等 关系 型 数据 库 ， 综 合 比较 来 阅 ，Oracle 的 优化 器 是 功能 最 强大 的 。 学 习 SQL 优化 ， 从 本 质 来 讲 就 是 学 习 从 优化 器 的 角度 如 
何 看 待 SQL， 如 何 制定 出 更 优 的 执行 计划 。 当 然 ， 优 化 器 本 身 是 数据 库 系 统 中 最 为 复杂 的 一 个 部 分 ， 本 书 会 就 优化 器 的 分 类 、 工 作 原理 等 做 简单 介绍 ， 不 会 深入 细节 。 


成 本 是 优化 器 (基于 成 本 的 优化 器 ) 中 反映 SQL 语句 执行 代价 的 一 个 指标 。 优 化 器 通过 比较 不 同 执行 计划 的 成 本 ， 选 择 成 本 最 小 的 作为 最 终 的 执行 计划 。 如 何 理解 成 本 、 成 本 如 何 计算 也 就 成 为 我 们 学 
习 基 于 成 本 的 优化 器 的 关键 所 在 。 


2.1 优化 器 


优化 器 在 整个 SQL 语句 的 执行 过 程 中 充当 了 非常 重要 的 角色 。 图 2-1 是 一 个 SQL 语句 从 提交 到 最 终 得 到 结果 的 示意 图 ， 从 中 我 们 可 以 看 到 优化 器 充当 的 角色 及 其 主要 功能 。 


[ 


Oracle 的 优化 器 也 是 在 不 断 演变 中 的 。 在 早期 的 版 本 中 ，Oracle 使 用 一 种 基于 规则 的 优化 器 。 顾 名 思 义 ， 它 是 按照 某 种 特定 的 规则 来 制定 执行 计划 的 。 这 种 方式 比较 简单 直观 ， 但 对 数据 库 自 身 情况 及 
SQL 语句 中 对 象 本 身 的 情况 都 没有 考虑 。 在 后 期 的 Oracle 版 本 中 ， 又 推出 了 另外 一 种 优化 器 一 一 基于 成 本 的 优化 器 。 下 面 将 对 两 种 主要 的 优化 器 分 别 加 以 介绍 ， 并 对 和 优化 器 相关 的 数据 库 参数 和 提示 进行 
说 明 。 


待 执行 的 SQL 语句 Query 


Optimization 


CBO | RBO 


目标 SQL 的 执行 结果 


实际 执行 执行 计划 


图 2-1 SQL 语句 执行 过 程 


2.1.1 ”基于 规则 的 优化 器 


基于 规则 的 优化 器 (Rule Based Optimizer，RBO) 内 部 采用 了 一 种 规则 列表 ， 其 中 每 一 种 规则 代表 一 种 执行 路 径 并 被 赋予 一 个 等 级 ， 不 同 的 等 级 代表 不 同 的 优先 级 别 。 等 级 越 高 的 规则 越 会 被 优先 采 
。 Oracle 会 在 代码 里 事先 给 各 种 类 型 的 执行 路 径 定 一 个 等 级 ， 一 共有 15 个 等 级 ， 从 等 级 1 到 等 级 15。Oracle 会 认为 等 级 值 低 的 执行 路 径 的 执行 效率 比 等 级 值 高 的 执行 效率 高 。 在 决定 目标 SQL 的 执行 计划 
时 ， 如 果 可 能 的 执行 路 径 不 止 一 条 ， 则 RBO 就 会 从 该 SQL 多 种 可 能 的 执行 路 径 中 选择 一 条 等 级 最 低 的 执行 路 径 来 作为 其 执行 计划 。 


1.RBO 的 具体 规则 


下 面 我 们 就 来 看 看 RBO 的 具体 规则 ， 如 表 2-1 所 示 。 
表 2-1 RBO 规 则 
等 级 序号 执行 路 径 等 级 
RBO Path 1 Single Row by Rowid Ee 


RBO Path 2 Single Row by Cluster Join 


RBO Path 3 Single Row by Hash Cluster Key with Unique or Primary Key 


RBO Path 4 Single Row by Unique or Primary Key 
RBO Path 5 Clustered Join 
RBO Path 6 Hash Cluster Key 


RBO Path 7 Indexed Cluster Key 
RBO Path 8 Composite Index 


RBO Path 9 Single-Column Indexes 
RBO Path 10 Bounded Range Search on Indexed Columns 
RBO Path 11 Unbounded Range Search on Indexed Columns 


RBO Path 13 MAX or MIN of Indexed Column 


RBO Path 14 ORDER BY on Indexed Column v 
RBO Path 15 Full Table Scan 最 低 


下 面 针 对 表 2-1 中 所 示 的 每 一 种 规则 的 含义 及 其 用 法 进行 说 明 。 


“Single Row by Rowid: 根据 ROWID， 返 回 一 条 记录 。 这 种 规则 发 生 在 SQL 语句 的 WHERE 部 分 ， 指 定 了 记录 的 ROWID 或 者 使 用 了 CURRENT OF CURSOR 形 式 的 SQL。 


“Single Row by ClusterjJoin: 根据 聚 丛 连接 ， 返 回 一 条 记录 。 这 种 规则 发 生 在 SQL 语句 中 WHERE 部 分 ， 包 含 了 两 表 关联 ， 且 关联 字段 为 一 个 聚 繁 ， 同 时 还 存在 一 个 过 滤 条 件 为 一 个 表 的 唯一 索引 或 主 


“Single Row by Hash Cluster Key with Unique or Primary Key: 根据 哈 希 聚 族 键 ， 返回 一 条 记录 。 这 种 规则 发 生 在 SQL 语 和 句 的 WHERE 部 分 所 包含 的 过 滤 条 件 中 ， 字 段 是 一 个 哈 希 聚 族 键 且 这 个 字段 为 唯一 或 
主键 索引 字段 。 


“Single Row by Unique or Primary Key: 根据 主键 或 唯一 索引 键 值 ， 返 回 一 条 记录 。 这 种 规则 发 生 在 SQL 语句 中 WHERE 部 分 ， 为 唯一 或 主键 所 有 字段 的 等 值 连接 条 件 。 
“ Clustered Join: 根据 聚 答 连 接 ， 返 回 一 组 记录 。 这 种 规则 跟 Path 2 类 似 ， 只 不 过 过 滤 条 件 中 没有 唯一 限制 ， 可 以 返回 多 条 记录 。 

Hash Cluster Key: 根据 哈 希 聚 儿 键 值 ， 返 回 一 条 记录 。 这 种 规则 跟 表 2-1 所 示 Path 3 类 似 ， 只 不 过 过 滤 条 件 中 没有 唯一 限制 ， 可 以 返回 多 条 记录 。 

“ Indexed Cluster Key: 根据 一 个 索引 的 聚 猴 键 字 段 ， 返 回 一 组 记录 。 

* Composite Index: 根据 一 个 组 合 索 引 字 段 ， 返 回 一 组 记录 。 这 种 规则 中 WHERE 部 分 需要 指定 组 合 索 引 字 段 且 通 过 逻辑 “与 ”运算 符 进行 连接 。 

“ Single-Column Indexes: 根据 单一 索引 字段 ， 返 回 一 组 记录 。 


“ Bounded Range Search on Indexed Columns: 根据 索引 字段 的 有 限 范 围 搜索 ， 返 回 一 组 记录 。 这 里 所 说 的 有 限 范 围 搜索 ， 包 括 字段 的 等 值 比较 、 大 于 等 于 和 小 于 等 于 、 
BETWEENhttp://www.hzcourse.com/resource/readBook?path=/openresources/teach_ebook/uncompressed/15654/OEBPS/Text/...AND、LIKE 等 过 滤 条 件 。 


“ Unbounded Range Search on Indexed Columns: 根据 索引 字段 的 无 限 范围 搜索 ， 返 回 一 组 记录 。 这 里 所 说 的 无 限 范围 搜索 ， 包 括 字 段 的 大 于 等 于 、 小 于 等 于 过 滤 条 件 。 
“ Sort Merge Join: 根据 排序 合并 关联 ， 返 回 一 组 记录 。 

:MAX or MIN of Indexed Column: 获取 一 个 索引 字段 的 最 大 、 最 小 值 。 这 种 规则 需要 遍历 整个 索引 。 

: ORDER BY on Indexed Column: 根据 一 个 索引 字段 ， 进 行 排序 操作 。 

“ Full Table Scan: 通过 全 表 扫描 方式 ， 获 取 一 个 结果 集 。 


2.RBO 在 实际 工作 中 的 应 用 


在 一 般 的 工作 场景 中 ， 很 少 会 涉及 使 用 RBO 的 情况 。 随 着 Oracle 自 身 技术 的 发 展 ，CBO 优 化 器 成 为 首选 。 只 有 在 极 个 别 的 情况 下 ， 需 要 手工 调整 执行 计划 时 ， 可 采取 指定 优化 器 参数 或 引用 相关 的 提示 
(参见 后 面 的 介绍 ) 。 需 要 注意 的 是 ， 因 为 RBO 技 术 出 现 比较 早 ， 很 多 新 的 技术 其 不 支持 ， 因 此 在 很 多 情况 下 即使 手工 指定 使 用 RBO 优 化 器 ， 也 可 能 会 失效 ，Oracle 仍 然 会 使 用 CBO 优 化 器 。 下 面 介绍 一 下 
失效 的 情况 。 


只 要 出 现 如 下 的 情形 之 一 (包括 但 不 限于 这 些 情形 ) ， 那 么 即便 修改 了 优化 器 模式 或 者 使 用 了 RULE Hint，Oracle 依 然 不 会 使 用 RBO (而 是 强制 使 用 CBO) 。 


- 目标 SQL 中 涉及 的 对 象 有 IOT。 


: 目标 SQL 中 涉及 的 对 象 有 分 区 表 。 


“ 使 用 了 并 行 查询 或 者 并 行 DML。 


“使 用 了 星 型 连接 。 


“ 使 用 了 哈 希 连接 。 


: 使 用 了 索引 快速 全 扫描 。 


: 使 用 了 函数 索引 。 


2.1.2 ”基于 成 本 的 优化 器 


基于 成 本 的 优化 器 (Cost Based Optimizer，CBO) 在 坚持 实事 求 是 原则 的 基础 上 ， 通 过 对 具有 现实 意义 的 诸多 要 素 的 分 析 和 计算 来 完成 最 优 路 径 的 选择 工作 。 这 里 的 关键 点 在 于 对 成 本 的 理解 ， 后 
会 有 对 成 本 的 专门 介绍 。 这 里 简单 交代 一 句 ， 成 本 可 以 理解 为 SQL 执 行 的 代价 。 成 本 越 低 ，SQL 执 行 的 代价 越 小 ，CBO 也 就 认为 是 一 个 更 优异 的 执行 路 径 。 


对 


随 着 Oracle 版 本 的 不 断 演 变 ，CBO 优 化 器 变 得 越 来 越 智能 ， 但 需要 注意 的 是 ，CBO 仍 然 存在 一 些 特殊 情况 ， 导 致 其 可 能 产生 较 差 的 执行 计划 。 这 也 是 以 后 CBO 发 展 ， 需 要 弥补 的 弱点 。CBO 存 在 的 问题 
主要 有 以 下 几 个 方面 : 


“ 多 列 关联 关系 : 在 默认 情况 下 ，CBO 认 为 WHERE 条 件 中 的 各 个 字段 之 间 是 独立 的 ， 并 据 此 计算 其 选择 率 ， 进 而 估计 成 本 来 选择 执行 计划 。 但 如 果 各 列 之 间 有 某 种 关系 ， 则 估算 的 结果 与 实际 结果 之 
间 往 往 存 在 较 大 误差 。 可 以 通过 动态 采样 或 者 是 多 列 统计 信息 的 方法 解决 部 分 问题 ， 但 都 不 是 完美 的 解决 方案 。 


: SQL 无 关 性 : CBO 认 为 SQL 语句 运行 都 是 相对 独立 的 ， 之 间 没 有 任何 关系 ; 但 在 实际 运行 中 可 能 是 有 关联 的 。 例 如 前 一 条 语句 访问 某 个 索引 ， 则 相关 数据 块 会 被 缓存 到 Data Buffer 中 ， 后 续 SQL 允 许 如 
果 也 需要 访问 这 个 索引 ， 则 可 以 从 Cache 获 得 ， 这 将 大 大 减少 读 取 成 本 ， 但 这 一 点 CBO 是 无 法 感知 的 。 


方 图 统计 信息 : 一 方面 在 12c 之 前 ， 基 于 频率 的 直方 图 的 桶 的 个 数 不 能 超过 254， 这 可 能 导致 一 些 精度 的 丢失 。 男 一 方面 ， 对 于 文本 型 字段 的 直方 图 收集 ，Oracle 只 会 提取 前 32 字 节 (对 于 多 字 节 字符 
集 来 说 更 加 严重 ) ， 这 样 获得 的 数据 会 失真 ， 可 能 会 导致 优化 器 获得 错误 的 执行 计划 。 


“ 复杂 多 表 关 联 : 对 于 复杂 的 多 表 关联 ， 其 可 能 的 表 间 关联 顺序 组 合 随 着 表 的 数量 增加 呈 几 何 级 数 增长 。 假 设 多 表 关 联 的 目标 SQL 包含 表 的 数量 为 n， 则 该 SQL 各 表 之 间 可 能 的 连接 顺序 的 总 数 就 是 nl 。 
CBO 在 处 理 这 个 问题 时 ， 是 有 所 取舍 的 。 在 118R2 的 版 本 中 ，CBO 在 解析 这 种 多 表 关 联 的 目标 SQL 时 ， 所 考虑 的 各 个 表 连 接 顺序 的 总 和 会 受到 隐 含 参数 OPTIMIZER_MAX PERMUTATIONS 的 限制 。 这 意味 
着 不 管 目标 SQL 在 理论 上 有 多 少 种 可 能 的 连接 顺序 ，CBO 至 多 只 会 考虑 其 中 根据 _ OPTIMIZER_MAX PERMUTATIONS 计 算出 来 的 有 限 种 可 能 。 这 同时 也 意味 着 只 要 该 目标 SQL 正确 的 执行 计划 不 在 上 述 有 
限 种 可 能 之 中 ， 则 CBO 一 定 会 漏 选 最 优 的 执行 计划 。 


2.1.3 ”对 比 两 种 优化 器 


RBO 和 CBO 的 优 缺 点 对 比如 表 2-2 所 示 。 


表 2-2 RBO 和 CBO 的 优 缺 点 对 比 


优 点 缺 点 

忽视 了 具有 实际 意义 的 统计 信息 而 导致 判断 误差 比较 大 。 
由 于 使 用 RBO 导致 制定 出 比较 差 的 执行 计划 的 概率 比 
较 大 。 

使 用 RBO， 执 行 计划 一 旦 出 了 问题 ， 很 难 对 其 做 调整 
使 用 RBO， 容 易 受 SQL 写法 的 不 同 导致 选择 不 同 执行 
计划 

Oracle 中 很 多 好 的 特性 、 功 能 不 能 在 RBO 下 使 用 


RBO 的 判断 有 章 可 循 、 有 律 可 
依 ， 易 于 用 户 对 其 判断 进行 正确 
的 预测 

A 在 已 经 创建 了 战略 性 索引 的 前 提 
下 这 些 规则 的 普遍 适 } 上 性 | 就 变 得 


总 到 了 了 对象 特征 信息 3 因此 是 
ee CBO 的 算法 十 分 复杂 ， 提 前 预测 执行 计划 比较 困难 


a 口 可 以 通过 对 统计 信息 的 管理 来 控 不 同 的 版 本 中 存在 严重 变化 ， 这 也 导致 了 升级 数据 库 带 来 


制 最 优化 。 的 风险 较 大 。 


减少 最 坏 情况 的 发 生 概 率 ， 不容 | 控制 执行 计划 比较 困难 ， 但 还 是 有 手段 可 以 控制 的 。 
易 产生 特别 差 的 执行 计划 


在 通常 情况 下 ， 已 经 没有 理由 不 选用 CBO 优 化 器 了 ， 这 也 是 Oracle 强 大 之 所 在 。 在 极 个 别 的 情况 下 ， 也 存在 对 CBO 优 化 器 不 适合 使 用 的 情况 下 ， 原 因 可 能 是 BUG 或 者 CBO 设 计 问 题 。 此 时 可 以 考虑 使 
RBO 优 化 器 ， 但 即使 是 这 种 情况 ， 也 要 严格 限制 特定 范围 ， 一 般 只 在 语句 级 使 用 RBO 优 化 器 。 


2.1.4 ”优化 器 相关 参数 


本 小 节 重 点 介绍 几 个 与 优化 器 密切 相关 的 参数 。 想 真正 了 解 优化 器 ， 这 些 参数 是 必须 掌握 的 。 


1.optimizer mode 


数据 库 使 用 哪 种 优化 器 主要 是 由 optimizer_mode 初 始 化 参数 决定 的 。 


(1) 取 值 说 明 


“RULE: 使 用 RBO 优 化 器 。 需 要 注意 的 是 即使 指定 数据 库 使 用 RBO 优 化 器 ,但 有 时 Oracle 数 据 库 还 是 会 采用 CBO 优 化 器 ， 这 并 不 是 Oracle 的 BUG， 主 要 是 由 于 从 Oracle 8i 后 引入 的 许多 新 特性 都 必须 在 
CBO 下 才能 使 用 ， 而 你 的 SQL 语 句 可 能 正好 使 用 了 这 些 新 特性 ， 此 时 数据 库 会 自动 转 为 CBO 优 化 器 执行 这 些 语句 。 


“CHOOSE: 根据 实际 情况 ， 如 果 数 据 字典 中 包含 被 引用 的 表 的 统计 数据 ， 即 引用 的 对 象 已 经 被 分 析 ， 则 使 用 CBO 优 化 器 ， 否 则 为 RBO 优 化 器 。Oracle 9i 的 默认 值 。 
“ALL_ ROWS: 为 CBO 优 化 器 使 用 的 第 一 种 具体 的 优化 方法 ， 以 数据 的 吞吐 量 为 主要 目标 ， 以 便 可 以 使 用 最 少 的 资源 完成 语句 。 是 10g 以 及 后 续 版 本 中 optimizer mode 的 默认 值 数 。 
“ FIRST ROWS: 为 优化 器 使 用 的 第 二 种 具体 的 优化 方法 ， 以 数据 的 响应 时 间 为 主要 目标 ， 以 便 快速 查询 出 开始 的 几 行 数据 。 


“ FIRST_ROWS_[1110|100|1000]: 为 优化 器 使 用 的 第 三 种 有 具体 的 优化 方法 ， 让 优化 器 选择 一 个 能 够 把 响应 时 间 减 到 最 小 的 查询 执行 计划 ， 以 迅速 产生 查询 结果 的 前 n 行 。 该 值 为 Oracle 9i 新 引入 的 。 注 意 
以 前 的 FIRST_ROWS 已 经 不 再 使 用 ， 仅 仅 是 为 了 向 后 兼容 的 需要 


(2) 默认 值 变 化 
:在 8i、9i 等 版 本 中 ， 默 认 是 使 用 CHOOSE 为 默认 值 ; 在 10g 及 以 后 不 再 支持 基于 RULE 的 优化 器 ， 新 的 默认 值 为 ALL ROWS。 因 此 ， 参 数值 CHOOSE 和 RULE 都 不 再 被 支持 。 


“ 虽然 从 Oracle 10g 开 始 ，RBO 优 化 器 已 不 再 被 Oracle 支 持 ， 但 RBO 优 化 器 的 相关 实现 代码 并 没有 从 Oracle 数 据 库 的 代码 中 移 除 ， 这 意味 着 即使 是 在 11gR2 中 ， 依然 可 以 通过 修改 优化 器 模式 或 使 用 RULE 
Hint 来 继续 使 用 RBO。 


(3) 相关 操作 


初始 化 参数 optimizer_mode 是 动态 的 ， 可 以 在 实例 级 或 会 话 级 改变 。 此 外 使 用 提示 (hint) ， 也 可 以 在 SQL 级 别 设置 优化 器 。 


// 查 看 实例 级 优化 器 设置 

select name, value, isdefault, ismodified, description 

from v$system parameter 

where name like '%optimizer modesg' 

// 修 改 会 话 级 优化 器 设置 

9 Sai on > optimizer mode=http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/.. 
当前 会 话 设 

select name, value, isdefault, ismodified, description 

fromv$parameter 

where name like '%optimizer mode%®'; 

// 相 关 提示 

/*+ all rows http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... */ 

/*+ first rows (n) http://www.hzcourse.com/resource/readBook?path=/openresources/teach ， ebook/uncompressed/15654/0EBPS/Text/.. od 


2.0ptimizer features enable 


optimizer features_enable 参 数控 制 使 用 的 优化 器 特征 的 版 本 ， 比 如 从 Oracle8i 升 级 到 了 Oracle9i， 默 认 情 况 下 参数 为 9.2.0， 如 果 将 它 设 置 为 8.1.6， 那 么 将 使 用 Oracle8i 的 优化 器 特征 。Oracle 不 推荐 
显 式 设置 该 参数 ， 而 是 更 改 应 用 程序 中 的 相关 SQL。 参 数 optimizer features_enable 不 仅 能 禁用 特性 而 且 能 禁用 BUG 修复 。 


(1) 相关 操作 


1) 查看 可 用 的 版 本 号 ， 代 码 如 下 : 


Select value 

fromv$parameter Valid values 

where name="'optimizer features enable'; 
VALUE 


10gR1 以 前 的 版 本 不 存在 这 个 视图 。 要 获得 可 用 版 本 号 ， 可 以 执行 一 个 错误 的 设置 ， 由 系统 提供 可 选项 。 类 似 下 面 的 做 法 : 


alter session set optimizer features enable="1.0.0'; 
ERROR: 


ORA-00096: invalid value 1.0.0 for parameter optimizer features enable, must be from among 
日 和 Gl, T0205 T0203 T0202 102.07l, T01053, 9 S01, S00 17s 
1 


2) 设置 版 本 号 : 可 以 在 实例 、 会 话 、SQL 级 别 设 定 optimizer_features_enable 参 数 。 设 置 示 例 分 别 如 下 。 


alter system set optimizer features enable='9.2.0'; // 实 例 级 别 
alter session set optimizer features enable='9.2.0'; // 会 话 级 别 
/*+ optimizer features enable ('9.2.0') */ //SQL 级 别 (Hint) 


(2) 测试 案例 


下 面 通过 一 个 简单 的 案例 说 明 optimizer_features_enable 参 数 的 作用 。 案 例 通过 设置 optimizer_features_enable 参 数 ， 模 拟 了 不 同 版 本 数据 库 中 ， 对 表 间 关联 处 理 方式 的 不 同 。 具 体 关 于 表 间 关联 的 
细节 ， 可 参见 本 书 相应 章节 ， 这 里 只 是 说 明 参 数 的 使 用 方法 。 案 例 中 数据 库 版 本 为 11gR2。 


1) 准备 工作 ， 具 体 如 下 : 


create table anti testl as select * from dba objects; 
create table anti test2 as select * from dba objects; 
desc anti testl; 


Name Null? Type 

OWNER VARCHAR2 (30) 
OBJECT NAME VARCHAR2 (128) 
SUBOBJECT_ NAME VARCHAR2 (30) 
OBJECT ID NUMBER 

DATA OBJECT ID NUMBER 
OBJECT TYPE VARCHAR2 (19) 
CREATED DATE 
LAST_DDL TIME DATE 
TIMESTAME VARCHAR2 (19) 
STATUS VARCHAR2 (7) 
TEMPORARY VARCHAR2 (1) 
GENERATED VARCHAR2 (1) 
SECONDARY VARCHAR2 (1) 
NAMESPACE NUMBER 
EDITION NAME VARCHAR2 (30) 


// 注 意 测试 表 中 的 OBJECT ID 字段 是 可 以 为 空 的 。 


2) 测试 11g 的 情况 ， 具 体 如 下 : 


Select * 
from anti testl a 
wherea.object id not in (selectb.object id from anti test2 b) ; 


| Id | Operation | Name | Rows | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT | | 65273 | 1384 (1) | 00: 00: 17 | 
I* 1 | HASH JOIN RIGHT ANTI NA| | 65273 | 1384 (1) 100 00; 17 1 
| 艺 | TABLE ACCESS FULL | ANTI_TEST2 | 102K| 292 (1) | 00: 00: 04 | 
| 3 1 TABLE ACCESS FULL | ANTI_TEST1 | 65273 | 292 (1) | 00: 00: 04 | 


人 在 1982 风度 人 和 对 于 上 述 表 间 关 联 ， 优 化 器 采用 了 哈 希 连接 的 处 理 方式 。 这 是 一 个 在 11g 版 本 中 新 增 的 特性 ， 称 为 “NULL AWARE”， 可 以 支持 空 字段 的 反 连 接 操作 使 用 哈 希 连接 处 理 。 在 老 的 版 本 中 ， 不 支持 这 样 处 理 ， 因 此 


3) 测试 10g 的 情况 


Select /*+ optimizer features enable ('10.2.0.57) */ * 
from anti testl a 
wherea.object id not in (selectb.object id from anti test2 b) ; 


| Id | Operation | Name | Rows | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT | | 65241 | 4372 (1) | 00: 00: 53 1 

|* 1 | FILTER 1 | | | | 

| | TABLE ACCESS FULL| ANTI TEST1 | 65273 | 292 (1) | 00: 00: 04 | 

[| TABLE ACCESS FULL| ANTI TEST2 | 97664 | 2 (0) | 00: 00: 01 | 

Wa 上 面 的 执行 计划 不 同 ， 这 里 是 因为 通过 提示 的 方式 修改 了 optimizer_features_enable 参 数 ， 指 定 优化 器 使 用 较 老 的 版 本 。 指 定 的 10.2.0.5 版 本 中 ， 只 能 使 用 这 种 原始 的 嵌 套 循环 方式 处 理 表 间 关联 。 
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2.1.5 ”优化 器 相关 Hint 


在 SQL 优化 中 ， 除 了 可 以 通过 修改 参数 的 方式 干预 优化 器 工作 外 ， 还 可 以 使 用 提示 的 方式 进行 干预 ， 而 且 这 种 方式 更 加 精准 、 不 影响 其 他 SQL， 故 使 用 场景 更 加 广泛 。 关 于 提示 
章节 中 详细 介绍 。 


Hint， 将 在 后 面 的 


1.ALL ROWS 


说 明 : 


:ALL _ ROWS 是 针对 整个 目标 SQL 的 Hint， 它 的 含义 是 让 优化 器 启用 CBO ， 而 且 在 得 到 目标 SQL 的 执行 计划 时 会 选择 那些 吞吐 量 最 佳 的 执行 路 径 。 这 里 的 “吞吐 量 最 佳 ”是 指 资源 消耗 量 ( 即 对 I/O、 
CPU 等 硬件 资源 的 消耗 量 ) 最 小 ， 也 就 是 说 在 ALL_ ROWS Hint 生 效 的 情况 下 ， 优 化 器 会 启用 CBO 〇 而 且 会 依据 各 个 执行 路 径 的 资源 消耗 量 来 计算 它们 各 自 的 成 本 。 


:ALL ROWS Hint 其 实 就 相当 于 对 目标 SQL 启用 CBO ， 其 优化 器 为 ALL_ ROWS。 从 Oracle 10g 开 始 ，ALL_ROWS 就 是 默认 的 优化 器 模式 。 这 也 意味 着 自 Oracle 10g 以 来 ， 默 认 情 况 下 优化 器 启用 的 就 是 
CBO， 而 且 会 依据 各 条 执行 路 径 的 资源 消耗 量 来 计算 它们 各 自 的 成 本 。 


“ 如果 在 目标 SQL 中 除了 ALL_ ROWS 之 外 还 使 用 了 其 他 与 执行 路 径 、 表 连接 相关 的 Hint， 则 优化 器 会 优先 考虑 ALL_ ROWS。 


格式 : 


/*+ ALL RONS */ 


范例 : 


select /*+ all rows */ empno, ename, sal, job from emp where empno=7369; 


2.FIRST ROWS (n) 


说 明 : FIRST_ROWS (n) 是 针对 整个 目标 SQL 的 Hint， 它 的 含义 是 让 优化 器 启用 CBO 模 式 ， 而 且 在 得 到 目标 SQL 的 执行 计划 时 会 选择 那些 得 以 最 快 响应 并 返回 头 n 条 记录 的 执行 路 径 ， 也 就 是 说 在 


CBO， 而 且 会 依据 返回 头 n 条 记录 的 响应 时 间 来 决定 目标 SQL 的 执行 计划 。 


FIRST ROWS (n) Hint 生 效 的 情况 下 ， 优 化 器 会 启 


格式 : 


/*+ FIRST ROWS (n) */ 


范例 : 


select /*+ first rows (10) */ empno, ename, sal, job from emp where empno=7369; 


优化 器 模式 -FIRST_ROWS_n: FIRST_ROWS (n) Hint 和 优化 器 模式 FIRST_ROWS_n 不 是 


是 除 1、10、100 和 1000 之 外 的 所 有 值 。 


alter session set optimizer mode=first rows 10; 


对 应 的 。 优 化 器 模式 FIRST_ROWS_n 中 只 能 是 1、10、100 和 1000,， 但 FIRST_ROWS (n) Hint 中 的 n 可 以 


忽略 情况 : 如 果 在 UPDATE、DELETE 或 者 含 如 下 内 容 的 查询 语句 中 使 用 了 FIRST_ROWS (n) Hint， 则 该 FIRST_ROWS (n) Hint 会 被 Oracle 忽 略 。 


集合 运算 (如 UNION、INTERSECT、MINUS、UNION AILL 等 ) 


+ GROUP BY 
* FOR UPDATE 

“ 聚合 函数 (比如 SUM 等 ) 
: DISTINCT 


: ORDER BY (对 应 的 排序 列 上 没有 索引 ) 


这 里 优化 器 会 忽略 FIRST_ROWS (n) Hint 是 


为 对 于 上 述 类 型 的 SQL 语言 而 言 ，Oracle 必 须 访问 所 有 的 行 记录 后 才能 返回 满足 条 件 的 头 n 行 记录 ， 即 在 上 述 情形 下 ， 使 


有 意义 的 。 


3.RULE 


说 明 : RULE 是 针对 整个 SQL 的 Hint， 它 表示 对 目标 SQL 启用 RBO。 


格式 : 


FIRST_ROWS (n) Hint 是 没 


/*+ RULE */ 


范例 : 


select /*+ rule */ empno, ename, sal, job from emp where empno=7369; 


RULE 与 其 他 Hint: RULE 通 常 不 能 与 除 DRIVING_SITE 以 外 的 Hint 联 用 ， 当 RULE 与 除 DRIVING_SITE 以 外 的 Hint 联 用 时 ， 其 他 的 Hint 可 能 会 失效 。 但 是 ， 当 RULE 和 DRIVING_SITE 联 


会 失效 ， 所 以 RULE Hint 最 好 是 单独 使 用 。 


最 佳 实践 : 不 推荐 使 用 RULE Hint。 一 是 因为 Oracle 早 就 不 支持 RBO 了 ， 二 是 因为 启用 RBO 后 优化 器 在 执行 


接 ) ， 这 也 就 意味 着 启用 RBO 后 目标 SQL 跑 出 正确 执行 计划 的 概率 将 大 大 降低 。 


时 ， 它 自身 可 能 


标 SQL 时 选择 的 执行 路 径 将 大 大 减少 ， 很 多 执行 路 径 RBO 根 本 就 不 支持 


忽略 情况 : 因为 很 多 执行 路 径 RBO 根 本 就 不 支持 ， 所 以 即使 在 目标 SQL 中 使 
' 目标 SQL 除 RULE 之 外 还 联合 使 用 了 其 他 Hint (比如 DRIVING_SITE) 。 

: 目标 SQL 使 用 了 并 行 执行 。 

: 目标 SQL 所 涉及 的 对 象 有 IOT。 

: 目标 SQL 所 涉及 的 对 象 有 分 区 表 。 


4 测试 案例 


下 面 通过 一 个 完整 的 案例 ， 介 绍 混合 使 用 各 种 不 同 的 提示 并 观察 其 效果 。 


准备 工作 ， 代 码 如 下 : 


了 RULE Hint， 如 果 出 现 了 如 下 


情况 (包括 但 不 限于 ) ，RULE Hint 依 然 会 被 Oracle 忽 略 。 


比如 哈 希 连 


Create table tl as Select * from dba objects; 

insert into tl1 select * from 七 1; 

insert into t1 select * from 七 1; 

commit; 

select count (*) from tl; => 292280 

// 构 造 了 一 张 测试 表 ， 数 据 规模 接近 30 万 

create index idx tl on tl (object id) ; 

// 对 OBJECT ID 字段 创建 了 索引 

update tl1 set object id=1 where rownum<288280; 

commit; 3 

select count (*) from tl where object id=1; => 288279 
// 手 动 修改 了 OBJECT_ID 的 值 ， 将 表 中 绝 大 多 数 记 录 的 OBJECT_ID 设 置 为 ] 


execdbms_stats.gather table stats ( 
ownname=>'HF', 
tabname=>'T1 7" ， 
estimate percent=>100, 
method opt=>'for columns size auto object id', 
cascade=>true) ; 
/ /收集 表 的 统计 信息 ， 注 意 此 时 也 收集 了 相关 对 象 一 一 索引 的 统计 信息 
selectclustering factor from dba indexes where index name='IDX T1'; => 4213 
人 2 当前 索引 的 聚 葡 因 子 为 4213。 关 于 聚 丛 因子， 后 面 章节 有 详细 说 明 。 这 里 商 单 说 明 一 下 ， 聚 化 因子 反映 了 索引 字段 的 顺序 和 表 中 数据 存储 的 有 序 关系 。 聚 化 因子 越 小 ， 说 明 索 引 字段 顺序 与 表 中 数据 存储 顺序 一 致 性 越 高 ; 反 
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execdbms_stats.set index stats ( 
ownname=>'HF', 
indname=>'IDX T1', 
clstfct=>10000， 
no_invalidate=>false) ; 
selectcIustering factor from dba indexes where index name='IDX T1'; => 10000 
ye 聚 付 因子 ， 将 其 设置 为 10000。 手 动 修改 统计 信息 ， 是 一 种 常用 的 优化 手段 ， 可 以 便于 我 们 分 析 问题 。 后 面 的 统计 信息 的 章节 会 有 详细 说 明 
# 


测试 SQL- 默 认 情 况 ， 具 体 如 下 : 


selectobject name, object id from tl where object id=1; 


| Id | Operation Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT | 287K| 19M| 1170 (1) | 0 
I* 1 | TABLE ACCESS FULL| Tl1 | 287K| 19M| 1170 (1 1 00s 


/* 在 默认 情况 下 ， 上 面 的 SQL 应 该 是 采用 的 索引 扫描 。 因 为 上 面 手工 修改 了 索引 的 聚 和 因子， 大 大 增加 了 索引 扫描 的 成 本 。 因 此 这 里 选择 使 用 了 全 表 扫 描 。 注 意 此 时 是 使 用 了 CBO， 且 优化 器 模式 为 默认 值 一 一 ALL_ROWS 


测试 SQL-first_rows (10) ， 具 体 如 下 : 


select /*+ first rows (10) */ object name, object id from tl where object_id=1; 


| Id | Operation | Name | Rows | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT | | 4 (0) | 00: 00: 01 | 
| 1 | TABLE ACCESS BY INDEX ROWID| T1 | | 4 (Oy 1 QO OQ OE | 
|* 如 | INDEX RANGE SCAN | IDX T1 | | | (0) | 00: 00: 01 1 


/* 这 里 使 用 了 一 个 提示 first_rows (10) ， 其 作用 是 优先 返回 10 条 记录 。 在 使 用 提示 后 ，Oracle 认 为 此 时 扫描 索引 TDX_T1 能 够 以 最 短 的 响应 时 间 返 回 满足 上 述 SQL 的 where 条 件 “object_id=1” 的 头 10 条 记录 ， 因 此 这 里 使 用 - 


测试 SQL-first_ rows (9) ， 具 体 如 下 : 


select /*+ first rows (9) */ object name, object id from tl where object id=1; 


| Id | Operation | Name | Rows | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT | | 11 | 4 (0) | 00: 00: 01 | 
| 1 | TABLE ACCESS BY INDEX ROWID| T1 | | 4 (Oy 1 QO0F O00: 0 | 
[| INDEX RANGE SCAN | IDX T1 | | 3 (0) | 00: 00: 01 | 


的 Rows 部 分 。 从 first_rows (10) 的 12 变 成 了 11 


(%CPU) 
| 0 | SELECT STATEMENT | | 287K| 19M| 1170 (1) | 
I* 1 | TABLE ACCESS FULL| T1 | 287K| 19M| 1170 (1)10 
Dr 

Ss Hint 其 实 就 相当 于 对 目标 SQL 启用 CBO 且 优化 器 模式 为 RLL RONS， 而 ALL_ ROWS 本 身 就 是 自 10g 以 来 优化 器 模式 的 默认 设置 ， 即 在 默认 情况 下 单独 使 用 ALL ROWS Hint 和 不 使 用 任何 Hint 的 效果 是 一 样 的 
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测试 SQL-rule， 具 体 如 下 : 


Select /*+ rule */ object name, object id from tl where object_id=1; 


0 | SELECT STATEMENT | | 
1 | TABLE ACCESS BY INDEX ROWID| T1 | 
2 1 INDEX RANGE SCAN | | 


- rule based optimizer used (consider using cbo) 
/* 注 意 执 行 计划 中 的 关键 字 “rule basedhttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/...”， 并 且 显 示 的 具体 执行 步骤 中 并 没有 “Cost 
A 


测试 SQL-rule+parallel， 具 体 如 下 : 


alter table tl1 parallel; 
select /*+ rule */ object name, object id from tl where object_id=1; 


| Id | Operation | Name |Cost (%CPU) | 

| 0 | SELECT STATEMENT | | 81 (0) | 

| 1 1 PX COORDINATOR | | | 

| 21 BFXSEND QC (RANDOM | : TO10000 | 81 (0) | 

| 等 1 PX BLOCK ITERATOR | | 81 (0) | 

lx 41 TABLE ACCESS FULL| T1 | 81 (0)1 

CT “Cost” 列 ， 这 表示 上 述 SQL 在 解析 时 使 用 的 是 CBO， 这 也 验证 了 之 前 的 观点 : 如 果 目 标 SQL 使 用 了 并 行 执行 ， 就 意味 着 其 中 的 RULE Hint 会 失效 ， 此 时 Oracle 会 自动 启用 CBO 
本 


2.2 成 本 


在 对 SQL 语句 进行 优化 的 过 程 中 ， 对 于 成 本 的 理解 非常 重要 。 因 为 Oracle 绝 大 多 数 情况 下 就 是 使 用 基于 成 本 的 优化 器 对 SQL 语句 制定 执行 计划 的 。 只 有 对 成 本 有 更 深层 次 的 认识 ， 才 能 理解 优化 器 的 行 
为 ， 也 更 容易 找 出 产生 较 差 执行 计划 的 原因 。 但 对 于 成 本 及 其 计算 方法 ，Oracle 公 司 并 没有 开放 很 多 资料 ， 因 而 只 能 从 一 些 公开 的 资料 揣摩 其 工作 原理 、 计 算 方法 等 。 


下 面 会 对 成 本 的 基本 概念 、 计 算 方法 加 以 简单 说 明 。 后 面 会 结合 一 个 SQL 案例 ， 阐 述 如 何 计算 一 个 成 本 。 最 后 ， 会 对 一 个 比较 重要 的 概念 一 一 选择 率 加 以 说 明 。 


2.2.1 基本 概念 


成 本 是 指 花费 在 单数 据 块 读 取 上 的 时 间 ， 加 上 花费 在 多 数据 块 读 取 上 的 时 间 ， 再 加 上 所 需 的 CPU 处 理 时 间 ， 然 后 将 总 和 除 以 单数 据 块 读 取 所 花费 的 时 间 。 也 就 是 说 ， 成 本 是 语句 的 预计 执行 时 间 的 总 


和 ， 以 单数 据 块 读 取 时 间 单 元 的 形式 来 表示 。 


成 本 的 概念 也 是 在 不 断 演 化 中 的 ， 在 不 同 的 Oracle 版 本 中 是 不 同 的 。 在 Oracle 8i 的 版 本 中 ， 成 本 是 考虑 了 I/O 子 系统 所 做 的 请 求 数 ， 并 没有 考虑 到 CPU 资源 的 使 用 开销 以 及 多 数据 块 访问 和 单数 据 块 访 


问 的 不 同 。 在 Oracle 9i 中 ， 引 入 了 对 CPU 成 本 的 计算 ， 此 外 也 加 入 了 对 单数 据 块 和 多 数据 块 MO 请 求 的 不 同 的 考虑 。 到 了 Oracle 10g， 又 引入 了 对 数据 分 布 特征 、 缓 存 数据 块 等 因素 的 考虑 。 


2.2.2 ”计算 公式 


成 本 的 具体 计算 公式 如 下 : 


Cost= (#SRDs*sreadtim+#MRDs*mreadtim+#CPUCycles/cpuspeed) /sreadtim 


公式 说 明 : 
“ #SRDs: 单数 据 块 读 取 的 次 数 。 

“ #MRDs: 多 数据 块 读 取 的 次 数 。 

“ #CPUCycles: CPU 时 钟 频率 。 

“ steadtim: 随机 读 取 单 数据 块 的 平均 时 间 ， 单 位 为 毫秒 。 

:mteadtim: 顺序 读 取 多 数据 块 的 平均 时 间 ， 也 就 是 多 数据 块 平均 读 取 时 间 ， 单 位 为 毫秒 。 


“ cpuspeed; 代表 有 负载 CPU 速度 ，CPU 速 度 为 每 秒 钟 CPU 周期 数 ， 也 就 是 一 个 CPU 一 秒 能 处 理 的 操作 数 ， 单 位 是 百 万 次 / 秒 。 


2.2.3 ”计算 示例 


下 面 通过 一 个 例子 ， 说 明 如 何 通 过 上 述 公 式 计算 一 条 SQL 语 句 的 运行 成 本 。 在 此 特别 强调 一 下 ， 成 本 的 计算 非常 复杂 ，Oracle 官 方 也 没有 公布 其 具体 的 算法 。 在 计算 中 ， 受 影响 的 因素 也 比较 多 。 下 酝 


的 示例 ， 仅 仅 作为 一 个 参考 ， 简 单 描述 了 计算 过 程 。 


下 面 的 示例 是 在 Oracle 10gR2 的 版 本 中 进行 的 ， 此 版 本 的 成 本 计算 中 既 包 含 了 MO 成 本 ， 也 包含 了 CPU 成 本 。 下 面 的 计算 中 就 包含 了 两 个 部 分 的 计算 过 程 。 
(1) 准备 工作 : 


Create table tl as select * from dba objects; 
exec dbms_stats.gather table stats (ownname=>'HF', tabname=>'T1', estimate percent=>100) 
// 创 建 了 一 个 测试 表 


(2) 优化 器 计算 成 本 : 


select * from t1; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT | | 51054 | 4636K| 200 (1) | 00: 00: 03 | 
| 1 | TABLE ACCESS FULL| T1 | 51054 | 4636K| 200 Cy | O00: 003 | 


// 对 于 上 述 这 条 SQL 语 句 ， 优 化 器 采用 了 全 表 扫 描 的 执行 方式 ， 其 估算 的 成 本 为 200 


(3) 10053 Trace: 在 开始 计算 之 前 ， 先 对 上 述 SQL 语 句 进行 一 次 10053 的 Trace。 通 过 这 个 跟踪 事件 可 以 观察 到 CBO 是 如 何 选择 执行 计划 的 。 关 于 这 个 跟踪 事件 的 具体 


法 ， 可 参见 本 书后 面 


在 后 面 的 计算 过 程 中 ， 我 们 可 以 参看 这 个 跟踪 事件 的 输出 。 


的 讲解 。 


alter session set events '10053 trace name context forever' 
select * from tl1; 
alter session set events '10053 trace name context off'; 


(4) 系统 统计 信息 : 先 来 查看 一 下 计算 公式 ， 在 公式 中 指标 Sreadtim、Mreadtim、cpuspeed 跟 具体 的 物理 硬件 有 关 。 在 Oracle 数 据 库 中 ， 可 通过 收集 系统 级 的 统计 信息 得 到 相关 的 数据 (关于 系统 


的 统计 信息 ， 可 参看 后 面 的 统计 信息 部 分 ) 。 如 果 数 据 库 没有 收集 相应 的 信息 ， 则 此 时 处 于 NOWORKLOAD 状 态 ， 这 种 情况 下 可 通过 几 个 新 的 统计 参数 折算 得 到 我 们 需要 的 指标 。 


在 10053 的 跟踪 事件 中 ， 我 们 可 以 找到 相关 的 部 分 : 


六 闪光 闪 奖 闪 风 大奖 六 次 关 次 交大 次 六 交火 奖 六 六 交 闪 奖 六 次 大奖 
SYSTEM STATISTICS INFORMATION 
六 交 交 次 交 大风 大奖 类 次 闪闪 六 次 六 交火 交火 次 交 交大 次 六 六 
Using NOWORKLOAD Stats 
CPUSPEED: 1251 millions instruction/sec 
IOTFRSPEED: 4096 bytes per millisecond (default is 4096) 
IOSEEKTIM: 10 milliseconds (default is 10) 


从 上 面 输出 中 可 见 ， 这 条 语句 执行 时 是 使 用 NOWORKLOAD 的 状态 ， 即 此 时 没有 收集 系统 的 统计 信息 。CPUSEED 已 经 给 出 ， 此 外 还 给 出 另外 两 个 统计 参数 IOTFRSPEED、IOSEEKTIM。 我 们 所 需要 的 


指标 可 以 通过 如 下 关系 进行 折算 。 在 计算 中 ， 还 涉及 另外 两 个 系统 参数 : 一 个 是 块 大 小 ， 由 db_block_ size 参数 设 定 ， 当 前 系统 为 8K; 另外 一 个 是 一 次 多 数据 块 读 取 的 块 数 ， 由 
db _file_ multiblock_read_count 参 数 设 定 ， 当 前 系统 为 8。 


Sreadtim = ioseektim + db block size/iotrfrspeed 
= 10 + 8192/4096 = 12 

Mreadtim = ioseektim + db file multiblock read count * db block size/iotfrspeed 
= 10 + 8*8192/4096 =26 本 加 加 


(5) 对 象 统计 信息 : 在 优化 器 计算 成 本 时 ， 还 需要 参考 对 象 级 的 统计 信息 。 我 们 可 以 通过 数据 字典 查看 ， 也 可 以 在 10053 的 Trace 文件 中 找到 。 在 此 跟踪 输出 中 ， 相 关 部 分 如 下 。 


灾 灾 炎 大 炎 赤 测 灾 灾 大 火灾 光大 灾 大 炎 赤 赤 灾 灾 大 炎 赤 光 太 赤 夫 炎 赤 赤 灾 炎 天 赤 炎 类 大 下 
BASE STATISTICAL INFORMATION 
兴 次 六 六 关 六 次 关 六 次 交办 次 六 六 交 六 交大 大兴 
Table Stats: : 
Table: T1 Alias: T1 


#Rows: 51054 #Blks: 723 AvgRowLen: 93.00 


// 从 上 面 的 输出 中 可 见 ， 表 T1 的 块 数 为 723。 对 应 于 全 表 要 描 而 言 ， 需 要 读 取 723 个 8K 的 数据 块 。 


(6) 计算 MO 成 本 : 前 面 提 到 过 ， 成 本 的 计算 分 为 两 个 部 分 ,分 别 为 /O 和 CPU。 下 面 简单 看 一 下 ，1/O 的 计算 过 程 。 前 面 提 到 的 计算 公式 如 下 。 


Cost = ( 
#SRDs * sreadtim + 
#MRDs * mreadtim + 
#CPUCycles /cpuspeed 
) / sreadtim 


简单 变换 一 下 : 


Cost = ( 
#SRDs 十 
#MRDs * mreadtim/sreadtim + 
#CPUCycles/ (cpuspeed * sreadtim) 
) 


其 中 前 两 行为 MO 成 本 ， 暂 不 考虑 最 后 一 行 ， 


因为 这 条 语句 为 全 表 扫 描 ， 使 


的 是 多 数据 块 读 取 的 方式 ， 


因此 ，1VO 成 本 计算 值 考虑 到 第 二 行 即 可 。 


IO_Cost = #MRDs * mreadtim/sreadtim 
= ceil (723/8) * 26 / 12 
= 197.17 
// 系 统 总 共 需 要 读 取 723 个 数据 块 ， 每 次 读 取 8 个 块 ， 共 需要 ceil (723/8) =91 次 


(7) 计算 CPU 成 本 : 


CPU_Cost = #CPUCycles/ (cpuspeed * sreadtim) 
= 25059861/ (1251*12000) 
1.67 


// 总 的 CPU 处 理 次 数 是 从 10053 中 得 到 的 ， 后 面 会 说 明 。 整 体 CPU 成 本 为 1. 67 


(8) 验证 成 本 : 下 面 解读 一 下 10053 的 成 本 计算 ,可 和 上 面 我 们 手工 计算 的 部 分 进行 对 比 。 


光 交 痰 突 册 突 关 交 次 奖 次 实 尖 闪 次 次 类 雁 兴 六 六 次 六 大 突 尖 闪 因 关头 大 六 关头 六 六 六 大 


SINGLE TABLE ACCESS PATH 


BEGIN Single 


TL Aliasg: TL 
Original: 51054 


Rounded: 


51054 Computed: 51054.00 Non Adjusted: 51054.00 


Access Path: TableScan 
Cost: 199.67 Resp: 199.67 Degree: 0 //CPU 成 本 为 199.67 - 198 = 1.67 
Cost io: 198.00 Cost cpu: 25059861 //IO 成 本 为 198 
Resp io: 198.00 Resp cpu: 25059861 
Best: : AccessPath: TableScan 
Cost: 199.67 Degree: 1 Resp: 199.67 Card: 51054.00 Bytes: 0 


从 10053 可 见 ， 优 化 器 计算 的 MO 成 本 为 198.00 (对 应 于 Cost io) 。 这 一 
成 本 计算 ，Cost_cpu: 25059861 就 是 前 边 引 


第 3 章 执行 计划 


点 和 计算 得 到 的 197.17 非 常 接近 。 考 虑 到 系统 中 有 隐 含 参数 ， 计 算 成 本 时 一 般 向 上 取 整 。 可 以 认为 两 者 就 是 一 致 的 。 对 于 CPU 
的 CPUCycles。 整 体 CPU 成 本 为 总 成 本 减 去 MO 成 本 ， 即 199.67-198 = 1.67。 这 和 我 们 前 面 计算 的 完全 一 致 。 


执行 计划 是 SQL 优化 的 基础 ， 只 有 在 充分 了 解 执行 计划 的 基础 上 才能 判断 语句 执行 是 否 高 效 。 如 何 获得 执行 计划 ?怎样 读 取 执行 计划 ?常见 的 执行 计划 有 哪些 ”如 何 干 预 执 行 计 划 ? 这 些 是 本 章 阐述 的 


中 
lll 
Bi 


3.1.1 什么 是 执行 计划 


数据 库 执行 SQL 语句 是 按照 一 定 顺 序 、 分 步骤 完成 的 。 至 于 采用 怎样 的 顺序 、 用 什么 方法 访问 数据 ， 是 由 优化 器 来 决定 的 。 一 旦 优化 器 确定 好 了 一 个 它 认 为 最 高 效 的 执行 方法 后 ， 这 一 系列 的 顺序 、 步 


又 就 被 称 为 执行 计划 。 简 言 之 ，Oracle 用 来 执行 目标 SQL 语句 的 这 些 步骤 的 组 合 就 被 称 为 执行 计划 。 


下 面 通过 一 个 示例 说 明 SQL 语 句 如 何 通过 多 个 步骤 处 理 得 到 需要 的 结果 集 。 


select e.ename, d.dname from emp e, dept d where e.deptno=d.deptno and e.empno=7900; 


| Id | Operation | Name | Rows | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT 二 | | 2 (0) | 00: 00: 01 | 
| 1 | NESTED LOOPS | | | 2 (0) | 00: 00: 01 | 
| 区 TABLE ACCESS BY INDEX ROWID| EMP | 各 小 工 (0) | 00: 00: 01 | 
Is 党 "| INDEX UNIQUE SCAN | PK FEMP | | 0 (0) | 00: 00: 01 | 
| 4 1 TABLE ACCESS BY INDEX ROWID| DEPT 1 4 1 时 《Oh O00 G0 DE 1 
| INDEX UNIQUE SCAN | PK DEPT | | 0 (0) | 00: 00: 01 1 


Predicate Information (identified by operation id) : 
3 - access ("E"."EMPNO" 
5 - access ("E"."DEPTNO"="D"."DEPTNO") 


1. 访 问 步骤 


1) ld = 0: 操作 为 SELECT STATEMENT。 这 一 行 实际 表示 语句 的 类 型 是 一 条 SELECT 语句 ， 而 非 一 个 真正 的 操作 。 


2) Id=1: 操作 为 NESTED LOOPS， 表 明 以 嵌 套 循环 的 方式 进行 表 间 关联 。 


此 在 一 些 执行 计划 显示 当中 ， 没 有 显示 ID = 0 的 操作 。 


3) Id = 2: 操作 为 TABLE ACCESS BY INDEX ROWID， 而 索引 上 的 ROWID 则 是 通过 子 步 骤 (ID = 3) 来 获取 的 。 


4) Id= 3: 操作 为 INDEX UNIQUE SCAN ， 表 了 明 对 索引 进行 唯一 键 值 的 访问 以 获取 父 操 作 所 需要 的 ROWID。 前 面 带 有 * 号 ， 说 明 这 个 操作 有 相关 的 谓词 条 件 (访问 条 件 或 过 滤 条 件 ) ， 后 面 会 有 详细 说 


5) ld =4: 操作 为 TABLE ACCESS BY INDEX ROWID， 而 索引 上 的 ROWID 则 是 通过 子 步骤 (ID = 5) 来 获取 的 。 


6) ld = 5: 操作 为 INDEX UNIQUE SCAN ， 表 明 对 索引 进行 唯一 键 值 的 访问 以 获取 父 操作 所 需要 的 ROWID。 前 面 也 带 有 * 号 。 


2. 谓 词 条 件 


1) 3-access ("E"."EMPNO"=7900) : 这 是 操作 ID = 3 的 谓词 条 件 ， 其 中 access 是 访问 条 件 ， 表 示 通 过 指定 条 件 定位 到 了 数据 。 


2) 5-access ("E"."DEPTNO"="D"."DEPTNO") : 这 是 操作 ID = 5 的 谓词 条 件 ，access 同 样 是 访问 条 件 ， 与 前 面 不 同 的 是 ， 这 里 的 条 件 值 不 是 直接 指定 的 ， 而 是 由 赃 套 循环 传 入 的 。 


执行 过 程 


上 面 语句 的 执行 是 由 多 个 步骤 组 成 的 ， 具 体 的 步骤 这 里 就 不 详细 介绍 了 ， 下 面 仅 描述 一 下 整体 执行 过 程 : 


sk 


首先 根据 指定 的 EMPNO=7900 的 条 件 ， 通 过 索引 PK_EMP 进 行 读 取 。 


2) 根据 读 取 到 的 索引 数据 中 的 ROWID 信 息 ， 返 回 查询 EMP 表 ， 获 得 其 他 需要 的 字段 。 


3) 按照 上 面 的 方式 循环 读 取 整 个 EMP 表 ， 对 于 获得 的 每 条 记录 进入 内 层 循环 。 


4) 内 层 循环 中 ， 根 据 传 入 的 DEPTNO 的 条 件 ， 通 过 索引 PK_DEPT 进 行 读 取 。 


5) 根据 读 取 到 的 索引 数据 的 ROWID 信 息 ， 返 回 查询 DEPT 表 ， 获 得 需要 的 字段 ， 然 后 返回 上 层 循环 。 


6) 整体 循环 结束 后 ， 返 回 结果 集 。 


3.1.2” 库 执行 计划 存储 方式 


数据 库 生成 执行 计划 ， 是 一 个 开销 很 大 的 工作 。 因 此 ， 一 般 数 据 库 都 会 采取 缓存 策略 。 将 生成 好 的 执行 计划 保存 起 来 ， 为 了 下 次 可 以 重用 它 ， 避 免 了 再 次 生成 产生 开销 。 在 Oracle 数 据 库 中 有 一 块 内 存 
域 称 为 库 高 速 缓存 〈 它 是 共享 池 的 一 部 分 ) 。 执行 的 SQL 语句 或 者 PL/SQL 块 ， 其 执行 计划 会 被 缓存 在 这 个 区 域 中 。 它 的 作用 就 是 当 相同 的 SQL 语句 或 者 PL/SQL 块 再 次 执行 时 ， 就 可 以 直接 利用 缓存 在 
区 域 中 的 执行 计划 ， 而 不 用 再 进行 昂贵 的 解析 操作 。 


于 风 


在 Oracle 数 据 库 中 ， 每 条 SQL 语句 都 有 一 个 称 为 SQL_ID 的 唯一 标识 。 在 对 一 条 SQL 语句 的 解析 中 ，Oracle 会 查询 在 库 高 速 缓存 中 是 否 存在 SQL_ ID。 如 果 不 存 在 ， 则 会 申请 一 块 内 存 区 域 用 来 保存 解析 后 
的 结果 。 在 逻辑 上 ， 这 块 内 存 区 域 保存 的 数据 结构 称 为 游标 。 在 内 存 区 域 中 ， 一 部 分 是 与 SQL 语句 相关 的 ， 被 称 为 父 游标 ; 另 一 部 分 是 与 语句 的 执行 计划 相关 的 ， 被 称 为 子 游标 。 从 名 字 就 可 以 看 出 ， 两 者 
是 有 主 从 关系 的 。 对 于 同一 条 SQL 语句 ， 可 能 会 存在 多 个 子 游标 ， 我 们 称 之 为 不 同 版 本 的 子 游标 。 不 同 的 子 游标 会 有 其 执行 计划 可 能 相同 ， 也 可 能 不 同 ; 但 它们 都 属于 同一 个 父 游标 。 每 个 子 游标 都 会 被 赋 
予 一 个 序列 号 ， 即 CHILD_NUMBER。 一 条 语句 生成 的 第 一 个 游标 的 CHILD_NUMBER 为 0， 相 应 的 Oracle 会 为 每 个 执行 计划 生成 一 个 哈 希 值 以 作 区 分 。 


下 面 通过 一 个 实例 ， 说 明 一 下 : 


<user scott> 

conn scott/tiger 

select empno, ename from emp; 

/* 当 一 条 SQL 第 一 次 被 执行 的 时 候 ，、 Oracle 会 同时 产生 一 个 父 游标 ( Parent Cursor) 和 一 个 子 游标 (Child Cursor) 
Af 


select sql text, sql id, version count 
from v$sqlarea 
where sql text like 'select empno, ename%®'; 
SQL TEXT SQL ID VERSION_COUNT 
select empno, ename from emp 78bd3uh4a08av 
/* 目 标 SQL 在 V$SQLAREA 中 只 有 一 条 匹配 记录 ， 且 这 条 记录 的 VERSION_COUNT 的 值 为 1 (VERSION ( Got (表示 某 个 Parent Cursor 拥 有 的 所 有 Child Cursor 的 数量 ) ， 这 说 明了 Oracle 在 执行 这 条 SQL 时 确实 只 产生 了 一 个 Par 
和 
select plan hash value, child number from v$sql where sql id='78bd3uh4a08av'; 
PLAN _ HASH VALUE CHILD NUMBER 
3956160932 0 
/* 从 V$SQL 中 查看 所 有 Child Cursor 的 信息 。 根 据 SQL ID 查询 VSSQL， 发 现 只 有 一 条 匹配 记录 ， 而 且 这 条 记录 的 CHILD_NUMBER 的 值 为 0 (CHILD_NUMBER 表 示 某 个 Child Cursor 所 对 应 的 子 游标 号 ) ， 说 明 Oracle 在 执行 原 目 林 
A 


<user hf> 

conn hf/hf 

create table emp as select * from scott .emp; 

select empno, ename from emp; 

select sql text, sql id, version count 

from v$sqlarea 员 加 

where sql_text like 'select empno，enameg'; 

SQL TEXT SQL ID VERSION_COUNT 

select empno, ename from emp 78bd3uh4a08av 人 

人 发 现 匹配 记录 的 VERSION_COUNTW 为 2， 说 明 这 个 SQL 语句 有 一 个 Parent Cursor 和 两 个 Child Cursor 


3 plan hash value, child number from v$sql where sql_id='78bd3uh4a08av' 
PLAN HASH VALUE CHILD ] NUMBER 
3956160932 ， 
3956160932 
/* 查 看 VSSQL， 可 以 看 到 CHILD ] NUMBER 的 值 分 分 别 为 0O 和 1， 表 示 有 两 个 Child Cursor。 这 里 产生 两 个 Child Cursor 的 原因 是 ， 虽 然 上 面 的 SQL 语 和 句 (“select empno，ename from emp”) 看 起 来 是 一 样 的 ， 但 是 是 由 两 个 不 
A 


3.2 ”解读 执行 计划 


3.2.1 执行 顺序 


当 我 们 阅读 一 个 执行 计划 时 ， 理 解 执行 计划 的 执行 顺序 非常 重要 。 这 对 于 我 们 理解 语句 实际 执行 过 程 ， 评 估 各 个 步骤 可 能 的 开销 并 进而 采取 优化 策略 等 都 有 很 大 的 帮助 。 遗 憾 的 是 ，Oracle 本 身 并 没有 
提供 一 个 直观 的 方法 可 以 一 目 了 然 地 看 到 语句 的 执行 顺序 ， 需 要 我 们 自己 根据 一 些 规则 去 判断 执行 顺序 。 下 面 针 对 这 些 规则 加 以 说 明 : 


“ 执行 计划 是 由 很 多 步骤 组 成 的 ， 步 又 之 间 有 一 定 的 执行 顺序 。 每 个 步骤 都 有 一 个 编号 。 


“ 步骤 之 间 存 在 父子 关系 。 父 子 关系 是 通过 缩 进来 体现 的 ， 子 节点 会 较 父 节点 向 右 缩 进 。 而 父 节 点 就 是 子 节点 上 面 离 它 最 近 的 左 移 节 点 。 如 图 3-1 所 示 ， 节 点 1 是 父亲 ， 节 点 2、3 是 它 的 孩子 ; 而 节点 3 又 


是 节点 4、5 的 父亲 。 


“ 父子 节点 之 间 的 缩 进 结构 形成 了 一 个 树 形 图 。 真 正 执行 顺序 是 从 树 形 顶 部 开始 ， 自 上 而 下 、 自 左 向 右 寻找 ， 直 到 到 达 某 个 节点 〈 这 个 节点 没有 子 节点 ) ， 首 先 执行 此 节点 。 此 后 执行 此 节点 同 级 的 节 
点 ， 执 行 顺序 从 上 而 下 。 在 树 形 结构 中 ， 如 果 某 个 节点 还 有 子 节点 ， 则 先 执行 子 节点 ; 执行 结果 不 断 上 移 到 父 节点 ， 直 到 汇总 到 顶级 节点 。 还 以 图 3-1 所 示 为 例 ， 按 照 自 上 而 下 、 自 左 向 右 的 顺序 ， 找 到 第 一 
个 没有 子 节点 的 节点 是 节点 2， 执 行 此 节点 ; 然后 自 上 而 下 找到 节点 3， 因 为 节点 3 还 有 子 节点 ， 因 此 先 执 行 这 些 子 节点 。 以 此 类 推 ， 整 个 的 执行 顺序 就 是 2-4-5-3-1。 


图 3-1 步骤 之 间 的 父子 关系 


下 面 通过 一 个 示例 ， 详 细 说 明 执行 顺序 。 


SELECT ename, job, sal, dname 
FROM emp, dept 
WHERE dept.deptno=emp.deptno and not exists ( 
SELECT * FROM salgrade WHERE emp.sal between losal and hisal) ; 


| Id | Operation | Name | 
| 0 | SELECT STATEMENT | | 
I* 1 | FILTER | | 
| 2 NESTED LOOPS | | 
| 久 | TABLE ACCESS FULL | EMP | 
| 4 1 TABLE ACCESS BY INDEX ROWID| DEPT | 
| 二 ”要 计 INDEX UNIQUE SCAN | EE PERT | 
人 使 和 硬 寺 TABLE ACCESS FULL | SALGRADE | 


“ 整个 执行 计划 有 Id 二 0~6， 总 共 7 个 步骤 。 在 Operation 列 采用 缩 进 格式 显示 。 


“ 执行 顺序 从 Id 二 0 开始 ， 按 照 自 上 而 下 、 自 左 到 右 ， 寻 找 缩 进 层次 最 深 且 没有 子 节点 的 节点 。 在 上 面 的 执行 计划 中 ，Id 二 3 是 满足 条 件 的 节点 〈Id=5 虽 然 缩 进 层 次 更 深 且 没有 子 节点 ， 但 其 父 节点 Id 一 4 
与 Id 一 3 的 节点 是 兄弟 关系 ， 且 从 Id 一 0 顶 节 点 往 下 找到 第 一 个 没有 子 节点 的 节点 是 Id 一 3 的 节点 ， 因 此 Id 一 3 的 节点 是 先 执行 的 节点 ) 。 


“ 对 于 Id 一 4 和 Id 一 5 这 两 个 节点 ， 是 父子 关系 。 按 照 先 子 节点 后 父 节 点 的 顺序 执行 ， 即 先 执 行 Id 一 5 节点 ， 然 后 执行 Id 一 4 节点 。 
“ 子 节点 执行 完毕 后 ， 将 结果 返回 到 上 级 节点 。 例 如 上 面 的 ld 二 3、4、5 执 行 完毕 后 ， 结 果 集 汇总 到 Id 二 2。 


上 例 整个 执行 顺序 为 3-5-4-2-6-1-0。 


3.2.2 ”访问 路 径 


在 执行 计划 中 的 Operation 列 ， 对 应 的 就 是 访问 路 径 ， 即 这 个 步骤 是 如 何 访问 数据 的 。 常 见 的 有 如 下 的 一 些 分 类 : 


“ 表 相 关 的 访问 路 径 : 这 部 分 主要 包括 ROWID 表 扫描 、 采 样 表 扫 描 、 全 表 扫 描 三 种 方式 。 即 针对 表 的 访问 ， 可 以 按照 上 面 三 种 方式 中 的 一 种 进行 。 


“ 索引 相关 的 访问 路 径 : 这 部 分 又 可 分 为 B 树 索引 访问 路 径 和 位 图 索引 访问 路 径 。B 树 索引 访问 路 径 主要 包括 索引 唯一 扫描 、 索 引 范 围 扫 描 、 索 引 全 扫描、 索引 快速 全 扫描 、 索 引 跳 跃 扫描 等 方式 。 位 图 
索引 访问 路 径 包 括 位 图 索引 单 键 扫 描 、 范 围 扫 描 、 全 扫描 、 快 速 全 扫描 及 按 位 与 、 或 、 减 等 方式 扫描 。 


“ 表 关 联 相关 的 访问 路 径 : 这 部 分 主要 包括 典 套 循环 连接 、 排 序 合 并 连接 、 哈 希 连 接 、 身 卡 儿 连 接 等 方式 。 


:和 SORT 相 关 的 访问 路 径 : 这 部 分 包括 聚合 、 去 重 、 分 组 、 排 序 等 排序 访问 方式 。 


“ 其 他 的 访问 路 径 : 这 部 分 包括 视图 、 集 合 、 层 次 查询 等 访问 方式 。 


如 何 理解 访问 路 径 这 个 概念 呢 ? 这 里 举 一 个 简单 的 示例 ， 后 文 将 有 对 这 些 执行 路 径 的 详细 介绍 。 例 如 ， 我 们 需要 对 一 个 数据 表 做 计数 工作 ， 即 统计 有 多 少 条 记录 。 如 果 是 采用 全 表 扫 描 的 访问 路 径 ， 则 
是 按照 表 中 记录 的 存储 顺序 ， 以 块 为 单位 ， 全 部 访问 所 有 数据 记录 。 


3.3 ”执行 计划 操作 
3.3.1 查看 执行 计划 


对 于 执行 计划 的 操作 ， 最 常见 的 就 是 查看 执行 计划 ， 这 是 对 SQL 进行 优化 的 前 提 条 件 。 取 得 一 个 真实 、 准 确 、 有 效 的 执行 计划 是 一 个 最 基本 的 要 求 。 然 而 ， 在 Oracle 中 存在 一 定 的 不 确定 性 ， 即 我 们 看 
到 的 执行 计划 和 真实 执行 的 可 能 完全 不 同 ， 这 取决 于 我 们 采用 的 收集 方法 。 下 面 我 们 会 着 重 介绍 几 种 执行 计划 的 查看 方法 ， 大 家 需要 区 分 不 同方 法 的 优 缺 点 、 适 用 情况 等 。 


1.EXPLAIN PLAN 


执行 这 条 命令 可 以 显示 指定 SQL 语句 的 执行 计划 和 相关 信息 ， 并 将 它们 作为 输出 存储 到 一 张 数据 表 中 ， 这 张 表 称 为 计划 表 (plan table) 。 在 使 用 这 个 命令 之 前 ， 首 先 要 确保 计划 表 存 在 ， 否 则 会 抛 出 错 
误 。 在 不 同 版 本 的 Oracle 中 ， 创 建 计划 表 的 方式 也 不 同 。 以 119 为 例 ， 如 果 需 要 手工 创建 计划 表 ， 执 行 4$ORACLE_ HOME/rdbms/admin/utlxplan.sql 脚 本 即 可 。Oracle 默 认 创建 的 是 名 称 为 plan_table 的 计 
划 表 ， 我 们 也 可 以 创建 自己 的 计划 表 ， 结 构 和 plan_table 一 致 即 可 。 需 要 注意 的 是 ， 该 工具 的 特点 是 并 没有 真正 执行 语句 ， 实 际 的 执行 过 程 可 能 与 Explain 分 析 结 果 不 一 样 。 


下 面 简单 介绍 一 下 这 个 命令 的 使 用 方法 ， 包 括 如 何 获取 执行 计划 、 如 何 查看 执行 计划 及 查询 输出 的 含义 。 


(1) 获取 执行 计划 


获取 执行 计划 的 方法 如 下 : 


explain Plan {set statement jd='<your ID>'} 
{into table <table name>} 
for <sql statement> 


参数 说 明 : 
“sql statement: 指定 需要 提供 执行 计划 的 SQL。 支 持 select、insert、update、merge、delete、create table、create index 和 alterfindex 等 类 型 。 


“statement_id: 指定 一 个 名 字 ， 用 来 区 分 存储 在 计划 表 中 的 多 个 执行 计划 。 名 字 可 以 是 包含 任意 字符 的 字符 串 ， 但 是 每 个 名 字 所 含 字符 不 能 超过 30 个 。 这 个 参数 为 可 选项 ， 黑 认 值 是 null。 


“ table_name: 指定 计划 表 的 名 字 。 这 个 参数 可 选 ， 默 认为 plan_table。 当 需要 的 时 候 ， 甚 至 可 以 为 它 指 定 schema、db link 等 。 


相关 权限 : 数据 库 用 户 在 执行 explain plan 语 名 时， 必须 对 作为 参数 传递 过 来 的 SQL 语句 有 执行 权限 。 注 意 当 参 数 里 包含 视图 时 ， 也 需要 该 用 户 对 视图 所 基于 的 基础 表 及 视图 有 访问 权限 。 


其 他 说 明 : 
“ EXPLAIN PLAN 是 DML 语 句 ， 而 不 是 DDL 语 句 。 这 意味 着 该 会 话 不 会 对 当前 事务 进行 隐 式 提交 ,仅仅 是 插入 几 条 记录 到 计划 表 。 
“如果 只 想 看 ORACILE 采 用 什么 执行 计划 ， 而 不 真正 执行 语句 ， 可 以 使 用 explain plan 命 令 。 类 似 于 set autotrace traceonly explain， 也 可 以 使 用 dbms_xplan。 这 个 包 也 是 读 取 plan_table 表 。 


(2) 查看 执行 计划 


查看 Explain 目 录 的 执行 计划 有 很 多 种 方法 ， 笔 者 推荐 使 用 DBMS_XPLAN 包 的 方式 。 


“ 直接 查询 计划 表 。 


explain Plan set statement id='queryl' for select * from tl1; 

column Plan format a70 

select lpad (' ', 3*level) || operation || ' (' || options ||') '|| object name || ' ' |lobject type 
from plan table 

connect by prior id=parent id and statement id='queryl'; 


:调用 dbms_xplan.display 函 数 。 


explain Plan for select http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/...; 
select * from table (dbms xplan.display) 
// 在 9iR2 以 后 的 版 本 中 ， 可 以 使 用 这 个 方式 查询 ， 效 果 更 好 也 更 容易 。 函 数 display 克 许 带 有 参数 调用 


“ 调用 脚本 。 


explain Plan for select http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/O0EBPS/Text/...; 
@ SORRACLE HOME/rdbms/admin/utlxpls.sql // 查 看 串 行 执行 计划 

@ SORRACLE HOME/rdbms/admin/utlxplp.sql] // 查 看 并 行 执行 计划 

//9i 下 只 能 查看 串 行 执行 计划 ，10g 既 可 以 查看 串 行 计划 ， 也 可 以 查看 并 行 执行 计划 


(3) 输出 说 明 


在 Explain 的 输出 中 ,包含 很 多 信息 。 辨 析 这 些 字段 的 具体 合 义 十 分 重要 。 下 面 结合 一 个 示例 ， 针 对 主要 的 字段 加 以 说 明 : 


SQL> explain Plan for select count (*) from tl1; 
Explained. 

SQL> select * from table (doms xplan.display) ; 
PLAN_TABLE OUTPUT 


| Id | Operation | Name | Rows | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT | | a 344 “1 | V0 00:° 05 | 
| 1 | SORT AGGREGATE | | 工 . | | 

| 2 1 TABLE ACCESS FULL| T1 | 73 | 344 人 


9 rows selected. 


“ COST: 指 cbo 中 这 一 步 所 新 费 的 资源 ， 这 个 值 是 相对 值 。 
“ CARD: 指 计划 中 这 一 步 所 处 理 的 行 数 。 
“ BYTES: 指 cbo 中 这 一 步 处 理 的 所 有 记录 的 字 节 数 ， 是 估算 出 来 的 一 组 值 。 


“ROWID: 是 一 个 伪 列 ， 对 每 个 表 都 有 一 个 ROWID 的 伪 列 ， 但 是 表 中 并 不 物理 存储 ROWID 列 的 值 。 不 过 你 可 以 像 使 用 其 他 列 那样 使 用 它 ， 但 是 不 能 删除 、 修 改 列 。 一 旦 一 行 数 据 插入 数据 库 ， 则 
ROWID 在 该 行 的 生命 周期 内 是 唯一 的 ， 即 使 该 行 产生 行 迁移 ， 行 的 ROWID 也 不 会 改变 。 


“RECURSIVE SQL: 有 时 为 了 执行 用 户 发 出 的 一 个 SQL 语 和 句 ，Oracle 必 须 执 行 一 些 额 外 的 语句 ， 我 们 将 这 些 额外 的 语句 称 为 fecursive cals。 如 当 一 个 DDL 语 和 名 发 出 后 ，ORACLE 总 是 隐 含 发 出 一 些 
RECURSIVE SQL 语 句 ， 来 修改 数据 字典 信息 ， 在 需要 的 时 候 ，ORACLE 会 自动 在 内 部 执行 这 些 语句 。 当 然 DML 语 句 与 SELECT 都 可 能 引起 RECURSIVE SQL。 简 单 说 ， 我 们 可 以 将 触发 器 视 为 RECURSIVE 


SQL。 


“ROW SOURCE: 行 源 。 用 在 查询 中 ， 由 上 一 操作 返回 的 符合 条 件 的 行 的 集合 ， 既 可 以 是 表 的 全 部 行 数据 的 集合 ， 也 可 以 是 表 的 部 分 行 数 据 的 集合 ， 还 可 以 是 对 前 两 个 row source 进 行 连接 操作 (如 join 
连接 ) 后 得 到 的 行 数据 集合 。 

' PREDICATE: 谓词 。 一 个 查询 中 的 WHERE 限制 条 件 。 

. DRIVING TABLE: 驱动 表 ， 又 称 为 外 层 表 OUTER TABLE。 这 个 概念 用 于 谋 套 与 哈 希 连 接 中 。 如 果 该 row source 返 回 较 多 的 行 数据 ， 则 对 所 有 的 后 续 操 作 有 负面 影响 。 如 果 一 个 大 表 能 够 有 效 过滤 数 


据 (例如 在 WHERE 条 件 有 限制 条 件 ) ， 则 该 大 表 作 为 驱动 表 也 是 合适 的 ， 所 以 并 不 是 只 有 小 表 可 以 作为 驱动 表 。 正 确 说 法 应 该 为 : 应 用 查询 的 限制 条 件 后 ， 返 回 较 少 行 源 的 表 作为 驱动 表 。 在 执行 计划 中 ， 
应 该 为 靠 上 的 那个 trow source， 在 后 面 描述 中 ， 一 般 将 该 表 称 为 连接 操作 的 row source 1。 


“ PROBED TABLE: 被 探查 表 。 该 表 又 称 内 层 表 INNER TABLE。 在 我 们 从 驱动 表 中 得 到 具体 一 行 的 数据 后 ， 在 该 表 中 寻找 符合 连接 条 件 的 行 。 所 以 该 表 应 当 为 大 表 (实际 上 应 该 为 返回 较 大 tow source 
的 表 ) 且 相 应 列 上 应 该 有 索引 。 在 后 面 的 描述 中 ， 一 般 将 该 表 称 为 连接 操作 的 row source 2。 


: CONCATENATED INDEX: 组 合 索 引 。 由 多 个 列 构成 的 索引 ， 如 create index idx_emp on emp (coll ，col2) 。 在 组 合 索引 中 有 一 个 重要 的 概念 引导 列 (leading column) 。 在 上 面 的 例子 中 ，coll 列 
为 引导 列 。 当 我 们 进行 查询 时 可 以 使 用 "where col1=? "， 也 可 以 使 用 "where col1=? and col2=? "， 两 者 都 会 使 用 索引 ， 但 是 "where col2=? "查询 就 不 会 使 用 该 索引 。 所 以 限制 条 件 中 包含 引导 列 时 ， 该 限制 条 


件 才 会 使 用 该 组 合 索 引 。 


:SELECTIVITY: 可 选择 性 。 比 较 一 下 列 中 唯一 键 的 数量 和 表 中 的 行 数 ， 就 可 以 判断 该 列 的 可 选择 性 。 如 果 该 列 的 “唯一 键 的 数量 / 表 中 的 行 数 ” 的 比值 越 接 近 1， 则 该 列 的 可 选择 性 越 高 ， 该 列 就 越 适 
合 创建 索引 ， 同 样 索引 的 可 选择 性 也 越 高 。 在 可 选择 性 高 的 列 上 进行 查询 时 ， 返 回 的 数据 就 较 少 ， 比 较 适 合 使 用 索引 查询 。 


2.AUTOTRACE 


AUTOTRACE 是 较 简 单 的 一 种 获取 执行 计划 的 方式 ， 往 往 也 是 最 常用 的 方法 。 有 一 点 需要 注意 : 使 用 AUTOTRACE 有 多 种 选 型 ， 不 同 选 型 决定 了 是 否 真正 执行 这 条 SQL， 其 对 应 的 执行 计划 有 可 能 是 真 


实 的， 也 有 可 能 是 虚拟 的 ， 要 加 以 区 分 。 从 本 质 上 来 讲 ， 当 使 用 AUTOTRACE 时 ，Oracle 实 际 上 启动 了 两 个 会 话 连 接 。 一 个 会 话 用 于 执行 查询 ， 另 一 个 会 话 用 于 记录 执行 计划 和 输出 最 终 的 结果 。 如 果 进 一 
步 查询 可 以 发 现 ， 这 两 个 会 话 是 由 同一 个 进程 派生 出 来 的 〈 一 个 进程 对 应 多 个 会 话 ) 。 


下 面 简单 介绍 一 下 这 个 命令 的 使 用 方法 ， 包 括 必 要 的 准备 工作 ， 不 同 选 型 的 区 别 及 查询 输出 的 含义 。 


(1) 准备 工作 


“ 创建 plan table: 


connect / as sysdba 
@ $ORACLE HOME/rdoms/admin/utlxplan 


“ 创建 同义词 : 


create public synonym Plan _ table for Plan table; 


“ 授权: 


grant all on Plan table to Public; 


“ 创建 plustrace 角色: 


Q@ $ORACLE HOME/sqlplus/admin/plustrce.sql 


“ 将 plustrace 角 色 授 予 public: 


grant plustrace to public; 


(2) 常用 选项 


注意 不 同 选 型 的 区 别 ， 可 根据 自己 的 需要 进行 选择 。 


“SET AUTOTRACE OFF: 不 生成 AUTOTRACE 报 告 ， 这 是 默认 模式 。 


:SET AUTOTRACE ON EXPLAIN: AUTOTRACE 只 显示 优化 器 执行 路 径 报告 。 


:SET AUTOTRACE ON STATISTICS: 只 显示 执行 统计 信息 。 


计 


:SET AUTOTRACE ON: 包含 执行 计划 和 统计 信息 。 执 行 完 语句 
执行 成 功 后 ， 才 返回 执行 计划 ， 使 优化 的 周期 大 大 增长 。 


， 会 显示 explain plan 与 统计 信息 。 这 个 语句 的 优点 就 是 它 的 缺点 ， 这 样 在 用 该 方法 查看 执行 时 间 较 长 的 SQL 语 句 时 ， 需 要 等 待 该 语句 


“ SET AUTOTRACE TRACEONLY: 同 SET AUTOTRACE ON, 但 是 不 显示 查询 输出 。 如 果 想 得 到 执行 计划 ， 而 不 想 看 到 语句 产生 的 数据 ， 可 以 采用 这 种 方式 。 这 样 还 是 会 执行 语句 。 它 与 SET 
AUTOTRACE ON 相 比 的 优点 是 : 不 会 显示 出 查询 的 数据 ， 但 是 还 是 会 将 数据 输出 到 客户 端 ， 这 样 当 语 名 查询 的 数据 比较 多 时 ， 语 句 执 行将 会 花费 大 量 的 时 间 ， 因 为 大 部 分 时 间 用 在 将 数据 从 数据 库 传 到 客 
户 端 上 了 。 笔 者 一 般 不 用 这 种 方法 。 


“SET AUTOTRACE TRACEONLY EXPLAIN: 如 同 用 explain plan 命 令 。 对 于 SELECT 语 句 ， 不 会 执行 语句 ， 而 只 是 产生 执行 计划 。 但 是 对 于 DML 语 句 ， 还 是 会 执行 语句 ， 不 同 版 本 的 数据 库 可 能 会 有 小 
的 差别 。 这 样 在 优化 执行 时 间 较 长 的 SELECT 语句 时 ， 大 大 减少 了 优化 时 间 ， 解 决 了 “set autotrace on” 与 “set autotrace ttaceonly” 命 令 优化 时 执行 时 间 长 的 问题 ， 但 同时 带 来 一 个 新 的 问题 : 不 会 产生 
statistics 数 据 ， 而 通过 statistics 数 据 的 物理 I/O 〇 的 次 数 ， 我 们 可 以 简单 的 判断 语句 执行 效率 的 优 劣 。 


“SET AUTOTRACE TRACEONLY STATISTICS: 和 SET AUTOTRACE TRACEONLY 一 样 ， 但 只 显示 执行 路 径 。 


(3) 输出 说 明 


AUTOTRACE 的 输出 有 两 个 部 分 一 一 查询 计划 报告 和 统计 数据 。 下 面 结合 一 个 示例 进行 说 明 : 


SQL> set autotrace on 
SQL> select count (*) from tl1; 
COUNT (*) 


86262 


| Id | Operation | Name | Rows | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT | | | 344 《了 | 00: 00:° 05 1 
| 1 | SORT AGGREGATE | | 11 | 

| 2 | TABLE ACCESS FULL| T1 | 85773 | 344 人 


31 recursive calls 
0 db block gets 
1275 consistent gets 
1234 physical reads 
0 redo size 
536 bytes sent via SQL*Net to client 
523 bytes received via SQL*Net from client 
2 SQL*Net roundtrips to/from client 
6 sorts (memory) 
0 sorts (disk) 
1 rows processed 


查询 计划 报告 如 下 : 


SELECT STATEMENT OPTIMIZER=CHOOSE (Cost=10 Card=328 Bytes=3842) 


这 个 部 分 包含 了 若干 的 属性 输出 ， 下 面 简单 介绍 一 下 各 个 属性 。 


“Cost: CBO 赋 予 执行 计划 的 每 个 步骤 的 成 本 。 


“ Card: 基数 的 简写 ， 它 是 特定 查询 计划 步骤 输出 的 记录 行 数 的 估算 。 


“ Bytes: CBO 预 测 的 每 一 个 计划 步骤 将 返回 的 数据 字 节 数量 。 
如 果 Cost、Card 和 Bytes 值 不 存在 ， 就 清楚 


地 表明 此 查询 使 用 的 是 RBO。 统 计数 据 如 下 : 


' Recursive calls: 为 执行 SQL 语句 递归 调用 SQL 语句 的 数目 。 
“ Db block gets: 用 当前 方式 从 缓冲 区 高 速 缓存 中 读 取 的 总 块 数 。 
在 缓冲 区 高 速 缓存 中 一 个 块 被 请 求 进行 读 取 的 次 数 。 读 取 方 式 为 一 致 性 读 取 。 


”Consistent gets: 


“ Physical reads: 从 数据 文件 到 缓冲 区 高 速 缓存 物理 读 取 的 数目 。 


“ Redo size: 语句 执行 过 程 中 产生 的 重 做 信息 的 字 节 数 。 

“Bytes sent via SQLYNet to client: 从 服务 器 发 送 到 客户 端的 字 节 数 。 
“Bytes received viaSQL#Net from client: 从 客户 端 接收 的 字 节 数 。 

: SQLYNet roundtrips to/from client: 从 客户 机 发 送 和 接收 的 SQLYNet 消 息 的 总 数 ， 
: 在 内 存 中 排序 次 数 。 


* Sorts (memory) 


* Sorts (disk) : 磁盘 排序 次 数 。 


Rows processed: 更 改 或 选择 返回 的 行 数 。 


3.SQL Trace (10046) 


SQL Trace 是 Oracle 提 供 的 用 于 进行 SQL 跟踪 的 手段 ， 是 强 有 力 的 辅助 ; 
些 信息 记录 在 Trace 文件 里 以 便 以 后 分 析 。 


一 致 性 读 取 可 能 需要 读 取 回 滚 段 的 信息 


包括 从 多 行 的 结果 集中 提取 的 往返 消息 。 


具 。 在 日 常 的 数据 库 问题 诊断 和 解决 中 ，SQL Trace 是 常用 的 方法 。 对 数据 库 进 行 性 能 诊断 可 以 使 用 SQL 跟踪 的 方法 ， 把 一 


10046 事 件 是 Oracle 提 供 的 内 部 事件 ， 是 对 SQL TRACE 的 增强 。 当 SQL 跟踪 用 于 高 于 1 的 等 级 时 ， 也 称 为 扩展 的 SQL 跟踪。 对 应 10046 有 不 同 的 级 别 ， 级 别 越 高 跟踪 的 粒度 越 细 ， 如 表 3-1 所 示 。 
表 3-1 10046 的 级 别 
Level 含 义 
0 停 用 SQL 跟踪 (相当 于 SQL_TRACE=FALSE )， 禁 止 调试 事件 
( 续 ) 
Level 含 义 
标准 SQL 跟踪 (相当 于 SQL_TRACE=TRUE )。 针 对 每 个 被 处 理 的 数据 库 调 用 ， 给 定 如 下 信息 
1 SQL 语句 、 啊 应 时 间 、 服 务 时 间 、 处 理 的 行 数 、 逻 辑 读 数量 、 物 理 读 与 写 的 数量 、 执 行 计 划 以 及 一 
些 领 外 信 息 
4 在 level 1 的 基础 上 增加 绑 定 变量 的 信息 ， 主 要 是 数据 类 型 、 精 度 及 每 次 执行 时 所 用 的 值 
8 在 level 1 的 基础 上 增加 等 待 事 件 的 信息 ， 包 括 等 待 事件 的 名 称 、 持 续 时 间 及 一 些 额 外 的 参数 等 
12 同时 启动 lsgvel4+8 


下 面 简单 介绍 一 下 这 个 


件 的 使 


方法 ， 包 括 必 要 的 准备 工作 、 如 何 跟踪 、 格 式 化 输出 结果 及 输出 含义 。 


(1) 准备 工作 


在 做 SQL Trace 之 前 ， 需 要 设置 一 些 参 数 。 参数 控制 跟踪 事件 的 详细 程度 或 者 限制 跟踪 文件 大 小 。 
计时 信息 
参数 timed statistics， 用 于 控制 计时 信息 是 否 可 用 ， 其 默认 值 依赖 了 
true。 
文件 大 小 


另外 一 个 参数 statistics_ level。 如 果 将 statistics_ level 设 定 为 basic， 则 timed _statistics 默 认为 false; 否则 ，timed _statistics 默 认为 


Trace 文件 的 最 大 尺寸 ( 重 
MAX_DUMP_FILE_SIZE 参 数 。 


位 为 操作 系统 块 ) ，UMLIMITED 表 示 没有 限制 。Oracle 8 以 后 可 以 在 后 | 
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文件 名 称 


生成 的 文件 有 内 置 的 命名 规则 ， 也 可 以 手动 指定 名 称 ， 便 于 辨识 。 


1) 默认 规则 : 


加 上 K 或 M 来 表示 文件 大 小 。 决 定 Trace 文件 大 小 的 因 


素 : 跟踪 级 别 、 跟 踪 时 长 、 


会 话 的 活动 级 别 和 


<instance name> <process name> <process id>.trc 


其 中 : 


' instance name: 初始 化 参数 instance_name 的 小 写 值 。 在 RAC 中 ， 与 初始 化 参数 db_name 不 同 ， 通 过 v$instance 视 图 的 instance_name 列 可 以 得 到 这 个 值 。 


“ process name: 产生 跟踪 文件 进程 的 小 写 值 。 对 于 专 有 服务 器 进程 ， 使 用 ora; 对 于 共享 服务 器 进程 ， 可 以 通过 v$dispatcher 或 v$shared_servet 视 图 的 name 列 获得 ;对 于 并 行 从 属 进 程 ， 可 以 通过 
Vv$px_process 视 图 server_name 列 获得 ; 对 于 其 他 多 数 后 台 进 程 来 说 ， 可 以 通过 v$bgprocess 视 图 的 name 列 获得 。 


“ process id: 操作 系统 的 进程 标识 ， 可 以 通过 v$process 视 图 的 spid 列 获得 。 
2) 人 工 标记 文件 : 在 生成 的 文件 名 中 就 有 这 个 标记 ,方便 寻 找 生成 的 跟踪 文件 。 


格式 : 


alter session set tracefile identifier='test'; 
alter session set sql trace=true; 


' 名称 格 式 : 


<instance name> <process name> <process id> <tracefile identifier>.trc 


“ 注意 事项 : 该 方法 只 对 专 有 服务 器 进程 有 效 。 每 次 会 话 动态 改变 该 参数 的 值 ， 都 会 自动 创建 一 个 新 的 跟踪 文件 。 参 数 tracefile_identifier 的 值 通 过 v$process 视 图 的 ttaceid 列 可 以 得 到 。 这 只 对 该 参数 的 会 
话 有 效 ， 其 他 会 话 看 到 的 值 为 NULL。 


文件 路 径 


跟踪 文件 生成 的 路 径 跟 服务 器 的 参数 设置 有 关系 。 不 同 的 数据 库 版 本 ， 文 件 路 径 也 有 差异 。 如 果 使 用 Oracle 的 共享 服务 器 连接 ， 就 会 使 用 一 个 后 台 进 程 ， 因 此 ， 跟 踪 文 件 的 位 置 是 由 
BACKUPGROUND_DUMP_DEST 确 定 。 如 果 使 用 的 是 专用 服务 器 连接 ， 就 会 使 用 一 个 用 户 进程 和 Oracle 交 互 ， 此 时 的 文件 路 径 在 USER_DUMP_DEST 下 。10g 及 以 前 版 本 的 查看 方式 如 下 : 


select rtrim (c.value, '/') ||'/'||ld.instance name|l|'_ ora '||ltrim (to char (a.spid) ) 1" .trc' as trace file name 
from v$process a, v$session b, viparameter c, v$instance d 
where a.addr=b.paddr and 

b.sid= (select sid from vSmystat where rownum<2) and 

b.audsid=sys_context ('userenv', 'sessionid') and 

c.name='user dump dest'; 


119 中 的 查看 方式 不 太一 样 。 在 11g 中 ，Oracle 以 更 简便 的 方式 提供 了 跟踪 文件 的 名 称 ， 这 依赖 于 ADR (Automatic Diagnostic Repository) 的 引入 。 初 始 化 参数 user_ dump_dest 与 
backupgroup_dump_dest 失 效 ， 转 而 支持 初始 化 参数 diagnostic_dest。 不 过 新 的 初始 化 参数 只 设 定 基本 目录 ， 可 以 使 用 v$diag_info 视 图 获得 跟踪 文件 的 准确 位 置 。 


select value from VSparameter where name='diagnostic dest'; 
select value from v$diag info where name = "Default Trace'; // 跟 踪 目 录 
select value from v$diag info where name = 'Default Trace File'; // 跟 踪 文件 


这 里 的 Default Trace File 就 是 默认 的 会 话 跟 踪 文件 名 称 。 


(2) 使 用 方法 (传统 方式 ) 


可 以 以 多 种 粒度 去 跟踪 对 象 ， 包 括 全 局 、 会 话 等 ， 下 面 分 别 说 明 。 


DO 


全 局 


启用 全 局 会 导致 所 有 进程 的 活动 被 跟踪 ， 包 括 后 台 进 程 及 所 有 用 户 进程 。 这 通常 会 导致 比较 严重 的 性 能 问题 ， 所 以 在 生产 环境 中 要 谨慎 使 用 。 通 过 启用 全 局 ， 可 以 跟踪 到 所 有 后 台 进 程 的 活动 ， 很 多 在 
文档 中 的 抽象 说 明 ， 通 过 跟踪 文件 的 实时 变化 ， 我 们 可 以 清晰 地 看 到 各 个 进程 之 间 的 紧密 协调 。 具 体 使 用 方法 可 以 通过 修改 参数 文件 加 入 以 下 参数 : 


sql trace=true 


or 
event="10046 trace name context forever, level 12" 


当前 会 话 


大 多 数 时 候 我 们 使 用 sql_trace 跟 踪 当前 进程 。 通 过 跟踪 当前 进程 可 以 发 现 当 前 操作 的 后 台数 据 库 递归 活动 (这 在 研究 数据 库 新 特性 时 尤其 有 效 ) ， 研 究 SQL 执 行 ， 会 发 现 后 台 错 误 等 。 具 体 使 用 方法 如 


alter session set sql trace=true; 

alter session set sql trace=false; 

or 

alter session set events '10046 trace name context forever'; 

alter session set events '10046 trace name context forever, level 8'; 
alter session set events '10046 trace name context off'; 


其 他 用 户 会 话 


除了 跟踪 当前 会 话 外 ， 也 可 以 跟踪 其 他 会 话 ， 方 法 有 很 多 种 。 


1) dbms_system 方 法 ， 具 体 如 下 : 


exec dbms_system.set sql trace in session ( 1234, 56789, true) ; 
exec Gbms_system.set sql trace in session ( 1234, 56789， false) ; 


默认 情况 下 ，dbms_system 包 只 能 被 sys 用 户 执 行 。 如 果 执行 所 需 的 权限 给 了 其 他 用 户 ， 需 要 慎重 ， 因 为 这 个 包含 了 其 他 过 程 ，set_ev 过 程 自身 也 能 用 来 设 定 其 他 事件 。 如 果 确 实 需 要 提供 给 其 他 用 户 在 
任意 会 话 内 激活 或 禁止 SQL 跟 踪 的 能 力 ， 建 议 使 用 另外 包含 必需 过 程 的 包 ， 这 个 包 就 是 dbms_support。 


2) dbms_support 方 法 ， 具 体 如 下 : 


exec dbms_support.start trace in session (sid => 1234, serial# => 56789, waits => true, binds => true) ; 
exec dbms_support.stop trace in session (sid => 1234, serial# => 56789) ; 


3) dbms system.set_ev 方 法 ， 具 体 如 下 : 


exec dbms_system.set_ev (si=>9, se=>437, ev=>10046, le=>8, nm=>'test') ; 
exec dbms_system.set ev (9, 437, 10046, 0, 'hf') ; 


其 中 : 

* si; session id， 即 会 话 ID。 

' se: serial number， 即 会 话 序列 号 。 
“ev: event number， 即 事件 号 。 


“ le: level， 即 TRACE 的 级 别 ，0 表 示 跟 踪 结束 。 


(3) 使 用 方法 (新 方式 ) 


10g 以 后 提供 的 dbms_monitor 包 来 开启 或 关闭 SQL 跟 踪 。 可 以 根据 会 话 属性 (客户 端 标 记 、 服 务 名 、 模 块 名 以 及 操作 名 ) ， 开 启 或 关闭 SQL 跟 踪 。 在 大 量 使 用 连接 池 的 场合 下 ， 用 户 不 


这 一 特性 很 


man 


会 话 级 


1) 使 用 方法 : 跟踪 内 容 是 通过 waits、binds 参 数 设置 完成 ， 不 同 于 以 前 的 通过 level 来 设置 。 


。 上 默认 情况 下 ， 只 有 dba 角 色 的 用 户 才能 执行 dbms_monitor 包 提供 的 过 程 。 可 以 对 会 话 级 、 客 户 端 级 、 组 件 级 、 数 据 库 级 等 多 种 粒度 进行 跟踪 。 


依赖 特定 的 


dbms_monitor.session trace enable (session id=>123, serial num=>23733, waits=>true, binds=>false) ; 
dbms_monitor.session trace disable (session id=>123, serial num=>23733) ; 


2) 查看 会 话 是 否 被 跟踪 : 


select sql trace, sql trace waits, sql trace binds 
from v$session 
where sid=xxx; 


在 10gR2 中 ， 当 启用 跟踪 后 ，v$session 会 设置 相应 值 。 但 需要 注意 的 是 ， 只 有 在 session_trace_enable 已 经 被 使 用 且 被 跟踪 的 会 话 至 少 执行 了 一 个 SQL 语 句 的 时 候 才 是 这 样 。 


3) 注意 事项 : 在 RAC 中 ，session_trace_enable 与 session_trace_disable 过 程 要 在 会 话 所 在 的 实例 上 执行 。 


客户 端 级 


1) 使 用 方法 如 下 : 


dbms monitor.client_ id trace enable (client id='hanfeng'， waits=>true, binds=>false) ; 
dbms_monitor.client id trace disable (client id='hanfeng') ; 


其 中 : 

“ client_id: 没有 上 默认 值 ， 区 分 大 小 写 。 
:waits: 是 否 跟踪 等 待 事件 ， 默 认为 true。 
“binds: 是 否 跟踪 绑 定 变量 ， 默 认为 false。 


2) 查看 客户 端 是否 被 跟踪 : 


select primary id as client id, waits, binds 
from dba enabled traces 
where trace type='CLIENT ID'; 


3) 注意 事项 : 只 有 在 会 话 属性 客户 端 标记 已 经 设 定 后 才 有 用 。 


组 件 级 

1) 使 用 方法 : 

dbms_monitor.serv mod act trace enable (service name=>'xxxx', module name=>'mymodule', action_name=>'myaction'，waits=>true，binds=>false，instance_name=>nul1) ; 
dbms_monitor.serv mod act trace diable (service name=>'xxxx', module name=>'mymodule', action name=>'myaction', instance name=>nul1l) ; 


“ setvice_name: 和 数据 库 相 关联 的 逻辑 名 字 。 可 以 通过 初始 化 参数 service_names 来 进行 设置 。 一 个 数据 库 可 以 有 多 个 服务 名 。 

- module_name: 默认 值 any_module，null 也 是 有 效 值 。 

“ action_name: 默认 值 any_action，null 也 是 有 效 值 。 如 果 指 定 了 参数 action_name ， 必 须 指定 参数 module_name， 否 则 会 抛 出 ORA-13859 错 误 。 
“ waits: 是 否 跟踪 等 待 事件 ， 默 认为 true。 

“ binds: 是 否 绑 定 变 量 ， 默 认为 false。 

“ instance_name: 如 果 使 用 RAC， 使 用 参数 instance_name 能 够 用 来 限制 对 单 实例 进行 跟踪 。 默 认 情 况 下 ，SQL 跟 踪 对 所 有 实例 都 是 开启 的 。 


2) 查看 组 件 是 否 被 跟踪 : 


Select primary id as service name, qualifier idl as module name, qualifier id2 as action name, waits, binds 
from dba enabled traces 
where trace _ type='SERVICE MODULE ACTION'; 


如 果 启用 SQL 跟 踪 没 有 指定 服务 名 、 模 块 名 、 操 作 名 这 三 个 属性 ，trace_type 列 将 设 定 为 SERVICE 或 SERVICE_MODULE， 具 体 设 定 为 哪个 取决 于 使 


了 哪个 参数 。 


数据 库 级 


1) 使 


方法 : 


dbms_monitor.database trace enable (waits=>true，binds=>true，instance_name=>nul1) ; 
dbms_monitor.database trace disable (instance name=>null) 


其 中 : 


“ waits; 是 否 跟踪 等 待 事件 ， 默 认为 true。 


“binds: 是 否 跟 踪 绑 定 变 量 ， 默 认为 flse。 


' instance_name: 限制 只 对 单一 实例 进行 跟踪 。 如 果 参 数 instance_name 设 定 为 nall， 也 就 是 默认 值 ， 将 对 所 有 的 实例 开启 SQL 跟踪 。 


2) 查看 数据 库 是 否 被 跟踪 : 


select 


instance name, waits, binds 


from dba enabled traces 


where 


trace type="'DATABASE'; 


(4) 分 析 日 志 


无 论 上 面 采 


原始 日 志 


哪 种 方式 收集 日 志 ， 都 需要 对 这 些 日 志 进 行 分 析 。 对 于 日 志 的 分 析 有 两 种 情况 ， 一 种 是 针对 原始 日 志文 件 ， 另 外 一 种 是 针对 TKPROF 处 理 后 的 日 志文 件 。 


一 般 情况 下 ， 不 会 直接 对 原始 日 志 进 行 分 析 。 但 对 于 处 理 后 的 日 志 ， 有 些 信息 会 丢失 ， 


下 面 对 内 容 指 标 进行 说 明 。 


1) PARSING IN CURSORhttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/...END OF STMT 


“len: 


“ dep: 


“uid: 


“ tim: 


* hv: 


"ad: 


2) PA 


被 分 析 的 SQL 的 长 度 。 


产生 递归 SQL 的 深度 。 


userid。 


: Oracle command type 命 令 的 类 型 。 


id: 私有 用 户 的 ID。 


时 间 戳 。 
hash value。 
sql address。 


RSE 表 示 和 解析，EXEC 表 示 执 行 ，FETCH 表 示 获 取 。 


“Cc; 消耗 的 cpu time。 


apsed time 操 作 的 用 时 。 


“ p: physical reads 物 理 读 的 次 数 。 


a 
舱 


* mis: 


: consistent reads 一 致 性 方式 读 取 的 数据 块 。 


: current 方 式 读 取 的 数据 块 。 


cursor miss in cache 硬 解析 次 数 。 


“fr; tows 处 理 的 行 数 。 


“ dep: 


"Og: 


* tim: 


depth 递 归 SQL 的 深度 。 


optimzer goal 优 化 器 模式 。 


timestamp 时 间 蕉 。 


3) BINDS: 绑 定 变量 的 定义 和 值 。 


4) WAIT: 在 处 理 过 程 中 发 生 的 等 待 事件 。 


5) STAT: 产生 的 执行 计划 以 及 相关 的 统计 。 


“ id: 执行 计划 的 行 源 号 。 


: 当前 行 源 返回 的 行 数 。 


: 当前 行 源 的 父 号 。 


: 执行 计划 中 的 位 置 。 


j: 当前 操作 的 对 象 ID (如 果 当 前 行 原 是 一 个 对 象 的 话 ) 。 


因此 必要 时 还 是 会 对 原始 日 志 进行 分 析 。 相 对 而 言 ， 原 始 日 志 看 起 来 不 是 很 方便 。 


: 主要 记录 SQL 语句 文本 。 


. op: 当前 行 源 的 数据 访问 操作 。 


下 面 我 们 来 看 一 个 实际 示例 : 


Oracle Database 10g Enterprise Edition Release 10.2.0.1.0 - Production 
With the Partitioning, OLAP and Data Mining options 
ORACLE HOME = /opt/oracle/products/10.2.0/db 1 


System name: Linux 

Node name: serverl 

Release: 2.6.16.60-0.21-default 

Version: #1 Tue May 6 12: 41: 02 UTC 2008 
Machine: i686 


Instance name: testdb 

Redo thread mounted by this instance: 1 

Oracle process number: 19 

Unix process pid: 25750, image: oracleQ@serverl (TNS V1-V3) 
二 LOS-31 15: 092 14035 

*** ACTION NAMP: () 2010-08-31 15: 05: 14.035 

*xx MODULE NAMP: (SQL*Plus) 2010-08-31 15: 05: 14.035 

*** SERVICE NAME: (SYSSUSERS) 2010-08-31 15: 05: 14.035 

*** SESSION ID: (139.1453) 2010-08-31 15: 05: 14.035 


上 面 是 Trace 文件 的 头 部 ， 记 录 了 Trace 文件 路 径 和 名 称 ，Trace 生 成 的 时 间 、 数 据 库 版 本 、 操 作 系统 版 本 、 实 例 名 等 。 


http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompresseq/15654/OEBPSVText/... 
PARSING IN CURSOR #4 len=210 dep=2 uid=0 oct=3 1id=0 tim=1253162423406877 hv= 864012087 ad="'2b691784' 

select /*+ rule */ bucket cnt, row cnt, cache cnt, null cnt, timestamp#, sample size, minimum, maximum, distcnt, lowval, hival, dens 
ity, col#, sparel, spare2, avgcln from hist head$ where obj#=: 1 and intcol#=: 2 

END OF STMT 

PARSE #4: c=0, e=101, p=0, cr=0, cu=0, mis=0, r=0, dep=2, 0g=3, tim=1253162423406868 

EXEC #4: c=0, e=69, p=0, cr=0, cu=0, mis=0, r=0, dep=2, 0g=3, tim=1253162423407167 

FETCH #4: c=0, e=44, p=0, cr=2, cu=0, mis=0, r=0, dep=2, 0g9=3, tim=1253162423407253 

STAT #4 id=1 cnt=0 pid=0 Pos=1 obj=255 op='TABLE ACCESS BY INDEX ROWID HIST HEAD$ (cr=2 pr=0 pw=0 time=55 us) ' 
STAT #4 id=2 cnt=0 pid=1 pos=1 obj=257 op='INDEX RANGE SCAN I HH OBJ# INTCOL# (cr=2 pr=0 pw=0 time=47 us) ' 
EXEC #1: c=4000, e=4202, p=0, cr=2, cu=0, mis=1, r=0, dep=1, 0g=1, tim=1253162423410127 

FETCH #1: c=4001, e=2300, p=0, cr=69, cu=0, mis=0, r=1, dep=1, 0g=1, tim=1253162423412502 

STAT #1 id=1 cnt=1 pid=0 pos=1 obj=0 op='SORT AGGREGATE (cr=69 pr=0 pw=0 time=2299 us) ' 

STAT #1 id=2 cnt=4622 pid=1 pos=1 obj=51785 op="'TABLE ACCESS SAMPLE T2 (cr=69 pr=0 pw=0 time=98 us) ' 


上 面 是 Oracle 对 SQL 语句 做 分 析 ， 并 且 有 一 个 游标 号 一 CURSOR#4。 这 个 号 在 整个 Trace 文件 中 不 是 唯一 的 。 当 一 条 SQL 语句 执 行 完毕 后 ， 这 个 号 会 被 另外 的 SQL 语句 
语句 分 析 了 一 次 ， 执 行 两 次 ，FETCH 两 次 。STAT# 就 是 对 SQL 执行 这 个 步骤 资源 消耗 的 一 个 统计 。 


。 从 上 面 可 以 看 出 这 个 SQL 


TKPROF 日 志 


TKPROF 用 来 解释 Trace 文件 内 容 ， 把 原始 的 Trace 文件 转化 为 容易 理解 的 文件 。 其 实 就 是 合并 汇总 Trace 文件 中 的 一 些 项 ， 规 范 化 文件 的 格式 ， 使 文件 更 具 可 读 性 。 需 要 注意 TKPROF 只 能 处 理 10046 寻 
件 产生 的 Trace 文件 。 下 面 解释 一 下 TKPROF 的 日 志 输出 。 


Wu 


1) 纵 行 (执行 的 几 个 阶段 ) : 


“ Parse (分 析 ) : 这 步 将 SQL 语句 转换 成 执行 计划 ， 包 括 检查 是 否 有 正确 的 授权 和 所 需 使 用 的 表 、 列 以 及 其 他 引用 到 的 对 象 是 否 存在 。 此 阶段 是 Oracle 在 共享 池 中 查找 〈 软 解析 ) 或 创建 查询 计划 〈 硬 解 
析 ) 的 所 在 。 


“ Execute (执行 ) : 这 步 真正 由 Oracle 来 执行 。 对 于 insert、update、delete 操 作 ， 这 步 会 修改 数据 ; 对 于 select 操 作 ， 这 步 就 只 是 确定 选择 的 记录 ， 在 很 多 情况 下 为 空 ; 对 于 update 语 句 ， 此 阶段 将 执行 所 
有 工作 。 


“Fetch (提取 ) : 返回 查询 语句 中 获得 的 记录 ， 这 步 只 有 select 语 句 会 被 执行 ; 对 于 update， 将 不 显示 任何 工作 。 
2) 横行 (各 信息 项 ) : 
: COUNT (计数 ) : 数据 库 调 用 数量 ， 即 这 个 语句 被 parse、execute、fetch 的 次 数 。 
“ CPU: 这 个 语句 对 于 所 有 的 parse、execute、fetch 所 消耗 的 CPU 的 时 间 ， 以 秒 为 单位 。 
ELAPSED (占用 时 间 ) : 这 个 语句 所 有 消耗 在 parse、execute、fetch 的 总 的 时 间 。 如 果 花 费 的 时 间 大 于 CPU 时 间 ， 意 味 着 花费 了 等 待 时 间 。 在 报告 的 底部 可 以 看 到 具体 的 等 待 事件 。 
“ DISK (磁盘 ) : 物理 读 的 数据 块 数量 。 注 意 ， 不 是 物理 IO 的 数量 。 如 果 这 个 值 大 于 逻辑 读 的 数量 (disk>query+current) ， 意 味 着 数据 块 填充 进 了 临时 表 空间 。 
:QUERY (查询 ) : 在 一 致 性 读 模 式 下 从 高 速 缓存 逻辑 读 取 的 块 数量 。 
:CURRENT (当前 ) : 在 当前 模式 下 从 高 速 缓 存 逻 辑 读 取 的 块 数量 。 通 常 这 类 训 辑 读 被 insert、delete、merge 及 update 等 语句 使 用 。 
:ROWS ( 行 ) : 所 有 SQL 语 句 返 回 的 记录 数目 ， 但 是 不 包括 子 查询 中 返回 的 记录 数目 。 对 于 select 语 句 ， 返 回 记 录 是 在 fetch 这 步 ; 对 于 insert、update、delete 操 作 ， 返 回 记录 则 是 在 execute 这 步 。 
3) 查询 环境 
“Misses in library cache during parse: n”: 是 否 在 库 中 进行 了 解析 (0 为 软 解析 1 为 硬 解析 ) 。 
“Misses in library cache during execute: n”: 执行 调用 阶段 硬 解 析 的 数量 。 
“Optimizer goal: xxx”: 优化 器 模式 。 
“Parsing userid: xxx”: 解析 SQL 语句 用 户 ID 
” (recursive depth: n) ”: 递归 深度 。 只 针对 递归 SQL 语句 提供 。 直 接 由 应 用 程序 执行 的 SQL 语句 深度 为 0， 深 度 为 n 仅 表示 另 一 个 深度 为 n 一 1 的 SQL 语句 执行 了 这 条 语句 。 
4) 查询 计划 : 


“两 部 分 ”: 如 果 指定 了 explain 参 数 的 话 可 能 会 看 到 两 部 分 。 第 一 部 分 被 不 够 准确 地 称 为 行 源 操作 (Row Source Operation) ， 是 游标 关闭 且 开 启 跟踪 情况 下 写 到 跟踪 文件 中 的 执行 计划 。 这 意味 着 如 
果 应 用 程序 不 关闭 游标 而 重用 它们 的 话 ， 不 会 有 新 的 针对 重用 游标 的 执行 计划 写 入 跟踪 文件 中 。 第 二 部 分 称 为 执行 计划 ， 是 由 指定 explain 参 数 的 tkprof 生 成 的 。 既 然 是 随后 生成 的 ， 所 以 和 第 一 部 分 不 完全 匹 
配 。 如 果 看 到 不 一 致 ， 前 者 是 正确 的 。 


“ 统计 信息 : 


“cr (number of buffers retrieved for CR reads) : 一 致 性 模式 下 逻辑 读 出 的 数据 块 数 。 


.pr (number of physical reads) : 磁 间 物理 读 出 的 数据 块 数 。 
-pw (number of physical writes) : 物理 写 入 磁盘 的 数据 块 数 。 

“ time: 百 万 分 之 一 秒 记 的 占用 时 间 ; us 代表 微 秒 。 

“ cost; 操作 的 开销 评估 (以 下 项 11g 才 提供 ， 以 下 各 项 均 是 如 此 ) 。 
size: 操作 返回 的 预 估 数 据 量 ( 字 节 数 ) 。 

“ card; 操作 返回 的 预 估 行 数 ( 除 了 card， 上 述 都 是 累计 的 ) 。 


5) 等 待 事件 : 总 结 了 SQL 语 句 的 等 待 事件 ， 对 每 种 类 型 的 等 待 事件 提供 了 如 下 值 。 


' Times Waited: 等 待 事件 占用 时 间 。 
“Max Wait: 单个 等 待 事件 最 大 等 待 时 间 ， 单 位 为 秒 。 


“ Total Waited: 针对 一 个 等 待 事件 总 的 等 待 秒 数 。 


6) 跟踪 文件 信息 : 输出 文件 的 结尾 给 出 所 有 关于 跟踪 文件 的 信息 。 这 部 分 信息 很 重要 ， 可 以 知道 整个 跟踪 文件 消耗 的 时 间 。 
“ 跟踪 文件 名 称 、 版 本 号 、 用 于 这 个 分 析 所 使 用 的 参数 sort 的 值 。 
“ 所 有 会 话 数量 与 SQL 语句 数量 。 
: 组 成 跟踪 文件 的 行 数 。 对 于 10g， 可 以 看 到 所 有 SQL 用 去 的 时 间 。 


7) 案例 说 明 : 


Trace 文件 头 部 的 信息 描述 了 tkprof 的 版 本 ， 以 及 报告 中 一 些 列 的 含义 。 在 下 面 的 报告 中 ， 每 一 条 SQL 都 包含 了 这 条 SQL 执行 过 程 中 的 所 有 信息 。 


TKPROF: Release 10.2.0.1.0 - Production on Tue Aug 31 15: 22: 45 2010 
Copyright (c) 1982, 2005, Oracle. All rights reserved. 

Trace file: testdb ora 25750 hf.trc 

Sort options: default 最 

六 闪 关 六 次 六 六 闪 交 六 类 大 六 奖 交 关 次 六 六 闫 次 六 交大 六 次 大兴 次 六 六 碳 交 六 次 闪 六 交大 大 次 六 六 碳 交 六 次 闫 六 交大 大 次 六 六 闪 交 六 交大 六 交大 大 次 六 炎 闪 关头 大 
count = number of times OCI procedure was executed 

cpu cpu time in seconds executing 


elapsed = elapsed time in seconds executing 

disk = number of physical reads of buffers from disk 

query = number of buffers gotten for consistent read 

Current = number of buffers gotten in current mode (usually for update) 
rows = number of rows processed by the fetch or execute call 


因 交 痰 突 六 闪光 交大 次 光 六 尖 闪 次 交 关 突 尖 容 六 六 类 大 六 突 尖 六 大奖 类 六 尖 闪 次 交大 记 光 关 凡 六 次 庙 大 六 关 闪 六 六 类 突 关 突 六 六 大 奖 炎 突 凡 六 因 交 大 大 尖 大大 交大 


下 面 是 SQL 在 解析 过 程 中 访问 数据 字典 视图 。 如 果 不 需 要 ， 可 以 使 用 tkprof sys=no 的 方式 来 屏蔽 它们 。 


alter session set sql trace=true 
http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/,.. 
Select i.obj#, i.ts#, i.file#, i.block#, i.intcols, i.type#, i.flags, i.property, 
i.pctfree$, i.initrans, i.maxtrans, i.blevel, i.leafcnt, i.distkey, i.lblkkey, 
i.dblkkey, i.clufac, i.cols, i.analyzetime, i.samplesize, i.dataobj#, 
nvl (i.degree, 1) , nvl (i.instances, 1) , i.rowcnt, mod (i.pctthres$, 256) ， 
i.indmethod#, i.trunccnt, nvl (c.unicols, 0) , nvl (c.deferrable#+c.valid#, 0) ， 
nvl (i.sparel, i.intcols) , i.spare4, i.spare2, i.spare6, decode (i.pctthres$, null, 
null, mod (trunc (i.pctthres$/256) , 256) ) , ist.cachedblk, ist.cachehit, 
ist.logicalread 
from 
ind$ i, ind stats$ ist, (select enabled, min (cols) unicols, 
min (to number (bitand (defer, 1) ) ) deferrable#, min (to number (bitand (defer, 4) ) ) 
valid# from cdef$ where obj#=: 1 and enabled > 1 group by enabled) c where 
i.obj#=c.enabled (+) and i.obj# = ist.obj# (+) and i.bo#=: 1 order by i.obj# 


下 面 的 语句 是 CBO 做 动态 采样 的 SQL 语句 ， 这 说 明了 这 个 表 没有 被 分 析 。 


http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 
SELECT /* OPT DYN SAMP */ /*+ ALL ROWS IGNORE WHERE CLAUSE 

NO_PARALLEL (SAMPLESUB) opt param ('parallel execution enabled', 'false') 

NO _ PARALLEL INDEX (SAMPLESUB) NO SQL TUNE */ NVL (SUM (C1) , : "SYS B 0") ， 

NVE (SUM (C2) ，: "SYS B 1") 5 mi 
FROM 和 

(SELECT /*+ NO PARALLEL ("T2") FULL ("T2") NO PARALLEL INDEX ("T2") */ 

: "SYS B 2" RS Cl, : "SYS B 3" RS C2 FROM "T2m SAMPLE BIOCK (: "SYS B 4" ， 

* ”SYS 日 5") SEED (: "SYS B 6") "T2") SAMPLESUB 


下 面 我 们 执行 的 SQL。 这 条 语句 分 析 了 1 次 ， 执 行 了 1 次 ， 数 据 提 取 了 2 次 (数据 提取 不 一 定 一 次 就 能 提取 完成 ) 。 


消耗 CPU 资源 0.02 秒 ， 总 耗 时 0.01 秒 。 物 理 读 取 0 个 数据 块 ， 一 致 性 读 取 693 个 块 。 没 有 发 生 current 方 式 的 读 取 ， 一 共 提 取 数 据 记 录 数 为 1。 


http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 
select count (1) from t2 


call count cpu elapsed disk query current rows 
Parse 1 0.00 0.00 0 1 0 0 
Execute 0.00 0.00 0 0 0 0 
Fetch 2 0 0.01 0 692 0 1 
total 4 0.02 0.01 0 693 0 1 


shared pool 中 没有 命中 ， 说 明 有 一 个 硬 解析 。 如 果 是 软 解析 ， 此 处 是 0。 


Misses in library cache during parse: 1 


当前 优化 器 模式 是 CBO ALL ROWS 


Optimizer mode: ALL ROWS 


分 析 用 户 的 ID 


Parsing user id: 55 (HF) 


下 面 是 实际 的 执行 路 径 。 这 个 计划 中 的 信息 不 是 CBO 根 据 表 分 析 数 据 估 算出 的 数值 ， 而 是 SQL 实 际 执行 过 程 中 消耗 的 资源 信息 。 


SORT AGGREGATE (cr=692 Pp Pw=0 time 699 us) 
TABLE ACCESS FULL T2 (cr=692 pr=0 pw=0 time=89 us) 


“ Rows: 当前 操作 返回 的 实际 记录 数 。 

“ Row Source Operation: 行 源 操作 (表示 当前 操作 的 数据 访问 方式 ) 。 

“cr (consistent read) : 一 致 性 方式 读 取 的 数据 块 (相当 于 query 列 上 fetch 步 骤 的 值 ) 。 
“ pr (physical read) : 物理 读 取 的 数据 块 (相当 于 disk 列 上 的 fetch 步 骤 的 值 ) 。 

:pw (physical wtite) : 物理 写 。 


“ time; 当前 操作 执行 的 时 间 。 


下 面 是 使 用 explain for 方 式 生成 的 SQL 执行 计划 : 


0 SELECT STATEMENT MODE: ALL RONS 
1 SORT (AGGREGATE) 
49934 TABLE ACCESS (FULL) OF 'T2' (TABLE) 


下 面 是 对 这 个 SQL_ TRACE 期 间 所 有 非 递归 SQL 语句 (NON-RECURSIVE STATEMENTS) 的 执行 信息 统计 汇总 。 


http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/O0EBPS/Text/... 
OVERALL TOTALS FOR ALL NON-RECURSIVE STATEMENTS 


call count cpu elapsed disk query current IOWS 
Parse 4 0.01 0.00 0 I 0 0 
Execute 5 0.00 0.00 0 0 0 2 
Fetch 名 0.01 0.01 0 692 0 1 
total il 0.02 0.02 0 693 0 3 


Misses in library cache during parse: 2 


下 面 是 所 有 递归 的 SQL 语句 的 信息 统计 。 递 归 语 句 是 指 执行 一 条 SQL 语句 衍生 出 执行 一 些 其 他 的 SQL。 比 如 读 取 数 据 字典 表 等 等 。 


OVERALL TOTALS FOR ALL RECURSIVE STATEMENTS 


Gall count cpu elapsed disk query current TOWS 
Parse 4 0.00 0.00 0 0 0 0 
Execute 4 0.00 0.00 0 0 0 0 
Fetch gt 0.00 0.00 0 27 0 14 
total 25 0.01 0.01 0 人 0 14 


Misses in library cache during parse: 1 
Misses in library cache during execute: 1 
6 user SQL statements in session. 

3 internal SQL statements in session. 
9 SQL statements in session. 
1 statement EXPLAINed in this session. 


下 面 是 整个 TRACE 文件 的 概要 说 明 ， 包 括 文件 名 、 扩 展 参数 、SQL 语 句 数量 等 内 容 。 


灾 赤 炎 灾 光 赤 不 赤 炎 赤 殉 天光 天 灾 赤 炎 赤 克 天 尖 赤 赤 灾 光大 类 次 寺 赤 火灾 光大 大 赤 炎 灾 光大 尖 天 灾 灾 炎 天 克 天 尖 赤 赤 灾 光大 大 关 灶 赤 炎 灾 克 天 大 赤 赤 天 炎 大 尖 天 类 天灾 天 页 


Trace file: testdb ora_25750_hf.trc 
Trace file Compatibility: 10.01.00 
Sort options: default 
Session in tracefile. 
user SQL statements in trace file. 
internal SQL statements in trace file. 
SQL statements in trace file. 
unique SQL statements in trace file. 
SQL statements EXPLAINed using schema: 
HF.prof$plan table 

Default table was used. 

Table was created. 

Table was dropped. 
112 lines in trace file. 
18 elapsed seconds in trace file. 


PowovOwoap 


4.V$SQLAONV$SQL PLAN 


使 用 数据 字典 视图 也 可 以 查看 执行 计划 。 因 这 种 方式 显示 的 执行 计划 不 太 直观 ， 故 不 太 常用 。 下 面 给 出 简单 示例 : 


SQL> select /*hf*/ count (*) from 七 1; 
COUNT (*) 

86262 

SQL> col oper format a20 

SQL> col options format a20 

SQL> col object name format al0 

SQL> select lpad (' ', 2*depth) ||operation, options, object name, cost 
from v$sql Plan 
where sql igd='dnfpxwhzrkpm7'; 


OPER OPTIONS OBJECT NAM COST 
SELECT STATEMENT 344 
SORT AGGREGATE 
TABLE ACCESS FULL T1 344 
5.DBMS XPLAN 


DBMS_XPLAN 是 Oracle 数 据 库 内 置 的 一 个 包 ， 通 过 它 可 以 查看 存储 在 不 同位 置 的 执行 计划 ， 包 括 计划 表 、 库 缓存 、 自 动 负载 信息 库 (AWR) 和 SQL 调 优 集 。 笔 者 认为 ， 它 是 在 众多 查看 执行 计划 的 方 


式 中 最 好 的 一 种 。 不 仅 支持 从 多 种 数据 源 显 示 执 行 计划 ， 且 显示 信息 比较 丰富 。 


根据 不 同 的 数据 源 ， 需 要 调用 DBMS_XPLAN 包 的 不 同方 法 ， 下 面 对 比 一 下 ， 如 表 3-2 所 示 。 


表 3-2 不 同 数据 源 调用 的 不 同方 法 


亲 使 用 数 据 源 
DISPLAY Explain plan 
DISPLAY CURSOR Real Plan 三 
DISPLAY AWR History AWR 仓库 基 表 WRHS$SQL PLAN 
DISPLAY SQLSET SQL Tuning Set SQL Set 视图 


下 面 针 对 不 同 的 方法 ， 分 别 加 以 说 明 。 


(1) DBMS XPLAN.DISPLAY 


DISPLAY 函 数 返 回 存储 在 计划 表 中 的 执行 计划 ， 返 回 值 为 集合 dbms xplan_type table 实 例 。 其 中 集合 里 的 元 素 是 对 象 类 型 dbms xplan_type 的 实例 。 此 对 象 类 型 的 唯一 属性 称 为 
plan_table_output， 类 型 为 varchar2。 注 意 : 使 用 前 把 sqlplus 的 linesize 参 数 调整 到 至 少 120。 


语法 : 


select * from 七 各 mS an.displa: e name', 'statement id', 'format', ilter preds $ 
1 able (doms_xplan.display ('table 1 a SE ', 'filter preds) ) 


参数 : 
“ table_name: 指定 计划 表 的 名 字 ， 上 默认 值 为 plan_table。 
“statement_id: 指定 SQL 语句 的 名 字 ， 当 SQL 语句 explain plan 执 行 时 ， 此 参数 是 可 选 的 。 上 默认 值 是 null， 在 使 用 默认 值 的 情况 下 ， 将 显示 最 近 插 入 计划 表 中 的 执行 计划 (如果 没有 指定 filter_preds 参 数 ) 。 


“ format: 指定 输出 哪些 内 容 。 除 了 基本 的 basic、typical、serial、al 和 advanced， 为 了 更 好 地 控制 ， 还 有 一 些 额 外 的 修饰 符 可 以 添加 在 后 面 (alias、bytes 等 ) 。 如 果 需 要 某 些 特殊 的 信息 ， 就 在 修饰 符 前 加 
一 个 “+” 字 符 〈 比 如 basic+bredicate) 。 如 果 不 需 要 哪些 信息 ， 就 在 修饰 符 前 加 一 个 “-” 字 符 ( 比 如 typical-bytes) 。 可 以 同时 指定 多 个 修饰 符 (typical+alias-bytes) 。 默 认 值 为 typical， 同 时 基本 值 advanced 和 
所 有 修饰 符 从 10gR2 开 始 可 供 使 用 。 


' filter_preds: 指定 在 查询 计划 表 时 添加 的 一 个 约束 。 约 束 的 内 容 是 基于 计划 表 中 某 个 字段 一 个 寻常 的 SQL 谓 词 ( 比 如 statement_id='xxx') ， 黑 认 值 是 null。 如 果 使 用 默认 值 ， 将 显示 最 近 一 条 插 到 计划 表 
中 的 执行 计划 。 这 个 参数 从 10gR2 开 始 使 用 。 


介绍 下 一 个 非常 重要 的 参数 一 一 FORMAT 参 数 。 


“ basic: 仅 显示 很 少 的 信息 。 基 本 上 只 包含 操作 和 操作 的 对 象 。 

“ typical: 显示 大 部 分 相关 内 容 ， 基 本 上 包含 除了 别名 、 提 纲 和 字段 投影 外 的 所 有 信息 。 
“ serial: 和 typicdl 类 似 ， 只 是 并 行 操作 没有 显示 出 来 。 

“a: 显示 除了 提纲 外 的 所 有 信息 。 

“ advanced: 显示 所 有 信息 。 

修饰 符 : 

“ alias: 控制 包含 查询 块 名 和 对 象 别名 部 分 的 显示 。 

“ bytes: 控制 执行 计划 表 中 字段 Bytes 的 显示 。 

“cost; 控制 执行 计划 表 中 字段 Cost 的 显示 。 


.note: 控制 包含 注意 信息 (note) 部 分 的 显示 。 


' outline: 控制 包含 提纲 (outline) 部 分 的 显示 。 
“ parallel: 控制 并 行 处 理 信息 的 显示 ， 尤 其 是 执行 计划 表 中 字段 TQ、IN-OUT 和 PQ Distrib 的 显示 。 


“partition: 控制 分 区 信息 的 显示 ， 尤 其 是 执行 计划 表 中 字段 Pstart 和 Pstop 的 显示 。 
“ peeked_binds: 控制 包含 被 窥视 的 绑 定 变量 部 分 的 显示 。 了 既然 SQL 语句 explain plan 的 当前 实现 不 执行 绑 定 变量 窥视 ， 这 部 分 内 容 就 不 会 显示 。 


' bredicate: 控制 包含 谓词 flterf 和 access 部 分 的 显示 。 


:brojection: 控制 包含 字段 投影 信息 部 分 的 显示 。 
“ remote: 控制 远程 执行 的 SQL 语句 的 显示 。 
“ tows: 控制 执行 计划 表 中 字段 Rows 的 显示 。 


示例 : 


SQL> explain Plan for select count (*) from tl1; 

Explained. 

SQL> select * from table (doms xplan.display (null, null, 'basic') ) ; 
PLAN_TABLE OUTPUT 


0 | SELECT STATEMENT | | 
| 1 | SORT AGGREGATE | . 
他 | TABLE ACCESS FULL| T1 | 


(2) DBMS XPLAN.DISPLAY_CURSOR 
显示 存储 在 库 缓存 中 的 执行 计划 。 注 意 此 函数 从 10g 开 始 可 供 使 用 。 返 回 值 是 集合 dbms_xplan_type_table 的 一 个 实例 。 


语法 : 


select * from table (doms xplan.display cursor ('sql id', cursor child no, 'format') ) ; 


参数 : 
“sql_id: 指定 被 返回 执行 计划 的 SQL 语句 的 父 游 标 。 默 认 值 是 null。 如 果 使 用 了 默认 值 ， 当 前 会 话 的 最 后 一 条 SQL 语句 的 执行 计划 将 被 返回 。 
“ cursor_child_no: 指定 父 游标 下 子 游标 的 序号 ， 即 指定 被 返回 执行 计划 的 SQL 语句 的 子 游标 ， 默 认 值 是 0。 如 果 设 定 为 null，sql_id 所 指 父 游标 下 所 有 子 游 标的 执行 计划 都 将 被 返回 。 


“ format: 指定 要 显示 那些 信息 ， 默 认 值 为 typical。 可 用 参数 和 display 相 同 。 此 外 ， 如 果 执 行 统计 打开 〈 参 数 statistics_level 为 台 或 SQL 语句 使 用 了 提示 gther_blan_statistics) ， 则 可 以 显示 更 多 的 信息 。 


下 面 来 


点 介绍 一 下 一 个 重点 参数 一 FORMAT 参数 。 


修饰 符 口 : 
.allstats: 这 是 iostats+memstats 的 快捷 方式 。 
* iostats: 控制 I/O 统 计 的 显示 。 
“ last: 显示 所 有 执行 计算 过 的 统计 。 如 果 指 定 了 这 个 值 ， 只 显示 最 后 一 次 执行 的 统计 信息 。 
* memstats: 控制 PGA 相 关 统 计 的 显示 。 
“ runstats_last: 和 iostats last 相 同 ， 只 能 用 于 10gR1。 
“runstats_tot: 和 iostats 相 同 ， 只 能 用 于 10gR1。 


示例 : 


SQL> select count (*) from 七 1; 
COUNT (*) 


SQL> select sql id, address, hash value , plan _ hash value , child number 

2 from v$sql 岗 加 

3 where sql text like '%select count (*) from t1g' and sql _ text not like 'g%vS$sal1g'; 
SQL ID ADDRESS HASH VALUE PLAN HASH VALUE CHILD NUMBER 


5bc0v4my7dvr5 000000006AA92650 4235652837 3724264953 0 
SQL> select * from table (dbms xplan.display cursor ('5bc0v4my7dvr5'，0，'advanced tallstats') ) ; 
PLAN TABLE OUTPUT 


SQL ID 5bc0v4my7dqvr5， child number 0 


select count (*) from tl 
Plan hash value: 3724264953 


| Id | Operation | Name | E-Rows | Cost (%CPU) | E-Time | 
0 | SELECT STATEMENT | | 344 (100) | | 

| 1 | SORT AGGREGATE 1 | 
2 1 


| | 
TABLE ACCESS FULL| T1 1] 8577 344 (2) { 90: 00: 05 1 


OP 


Query Block Name / Object Alias (identified by operation id) : 
1 - SELS1 
2 - SELS1 / T1@SELS$1 

Outline Data 


PLAN TABLE OUTPUT 


/x+ 
BEGIN OUTLINE DATA 
IGNORE OPTIM FMBEDDED HINTS 
OPTIMIZER FEATURES ENABLE ('11.2.0.4') 
DB_VERSION ('11.2.0.4') 
ALL ROWS 
OUTLINE LEAF (@"SELS1") 
FULL (QSELS1" "T1"@"SELS$S1") 
END_ OUTLINE DATA 
x 
7 
PLAN_TABLE OUTPUT 


Column Projection Information (identified by operation id) 


1 - (#keys=0) COUNT (*) [22] 


- Warning: basic Plan statistics not available. These are only collected when: 
PLAN_TABLE OUTPUT 
* hint "gather Plan statistics' is used for the statement or 
* parameter 'statistics level' is set to 'ALL', at session or system level 


(3) DBMS XPLAN.DISPLAY AWR 


回 


DISPLAY_AWR 函 数 返 


存储 在 AWR 中 的 执行 计划 ， 从 10g 起 可 用 。 返 回 值 是 集合 dbms xplan_type _table 的 一 个 实例 。 


语法 : 


select * from table (domx xplan.display awr ('sql id', plan hash value, db id, 'format') ) ; 


参数 : 


“sql_id: 指定 被 返回 执行 计划 的 SQL 语句 的 父 游 标 。 此 参数 没有 默认 值 。 


“ plan_hash_value: 指定 被 返回 执行 计划 的 SQL 语句 的 哈 希 值 ， 默 认 值 为 null。 如 果 使 用 了 默认 值 ， 与 sql_id 参 数 指定 的 父 游标 相关 的 所 有 执行 计划 都 会 返回 。 


“ db_id: 指定 被 返回 执行 计划 的 SQL 语句 所 在 的 数据 库 ， 默 认为 nnl。 如 果 使 用 了 默认 值 ， 则 数据 库 为 当前 库 。 
“ format: 指定 要 显示 哪些 信息 。 和 display 函 数 中 的 format 有 相同 的 参数 ， 默 认为 typical。 


(4) 输出 说 明 


无 论 使 用 哪 种 方法 ， 其 大 致 都 包含 相同 的 输出 项 。 下 面 针 对 输出 的 各 个 部 分 进行 详细 说 明 。 


第 一 部 分 : 


Sql _ id xxxxxxxxxx, child number 0 


select t2.* from t tl, t t2 where tl.n = t2.n and tl.id > 6 and t2.id between 6 and 19; 


其 中 : 


“sql_id: 标识 父 游标 。 只 有 调用 display_cursot 或 display_awt 函 数 时 才 有 此 信息 。 


“child number: 属于 这 个 sql_id 的 子 游标 序号 ， 可 以 标识 出 子 游标 。 只 有 调用 display_cutsor 函 数 时 才 会 产生 这 个 数据 。 


* selecthttp://www.hzcourse.com/resource/readBook?path=/openresources/teach_ebook/uncompressed/15654/OEBPS/Text/...: 


第 二 部 分 : 


SQL 语句 内 容 。 只 有 在 调用 display_cursor 或 display_awt 函 数 时 产生 。 


PLAN _ TABLE OUTPUT 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT | | 14 | 7756 | 42 | 
I* 1 | HASH JOIN | | 14 | 7756 | 42 (3 006 O07 Ot | 
| 2 TABLE ACCESS BY INDEX ROWID 

| | 14 | 7392 | 5 (0) | 00: 00: 01 | 
[| INDEX RANGE SCAN 人工 ER | 14 | | 2 (0) | 00: 00: 01 | 
I* 4 1 TABLE ACCESS FULL [ey | 382 | 25532 1 36 (0) | 00: 00: 01 | 


包含 执行 计划 的 哈 希 值 和 以 表格 形式 展现 的 执行 计划 本 身 。 表 格 中 提供 了 每 一 步 操作 的 执行 路 径 、 对 象 、 影 响 行 数 、 成 本 等 信息 。 此 外 ， 关 于 分 


1) 基本 字段 (总 是 可 用 的 ) : 


“ Id: 执行 计划 中 每 一 个 操作 ( 行 ) 的 标识 符 。 如 果 数 据 前 面 带 有 星 号 ， 意 味 着 将 在 随后 提供 这 行 包 含 的 谓词 信息 。 


"Operation: 执行 的 操作 ， 又 称 行 源 操作 。 

“ Name: 操作 的 对 象 。 

2) 查询 优化 器 评估 : 

“ Rows (E-Rows) : 评估 中 操作 返回 的 记录 条 数 。 

“ Bytes (E-Bytes) : 评估 中 操作 返回 的 记录 字 节 数 。 


' TempSpc: 评估 中 操作 使 用 的 临时 空间 大 小 。 


自 


区 、 并 行 处 理 、 运 行 统计 部 分 只 有 在 存在 时 才 会 显示 。 


“Cost (%CPU) : 评估 中 操作 的 开销 。 在 括号 内 列 出 了 CPU 开销 的 百分比 。 注 意 这 些 值 是 通过 执行 计划 计算 出 来 的 。 换 名 话说 ， 父 操作 的 开销 包含 子 操作 的 开销 。 


“Time: 评估 中 执行 操作 需要 的 时 间 (HH: MM: SS) 。 


网 


3) 分 


.Pstart: 访问 的 第 一 个 分 区 。 如 果 解 析 时 不 知道 是 哪个 分 区 ， 就 设 为 KEY、KEY (I) 、KEY (MC) 、KEY (OR) 或 KEY (SQ) 。 


“ Pstop: 访问 的 最 后 一 个 分 区 。 如 果 解 析 时 不 知道 是 哪个 分 区 ， 就 设 为 KEY、KEY (TD) 、KEY (MC) 、KEY (OR) 或 KEY (SQ) 。 


4) 并 行 和 分 布 式 处 理 : 
“ Inst: 在 分 布 式 操作 中 ， 指 操作 使 用 的 数据 库 链 的 名 字 。 
"TQ: 在 并 行 操作 中 ， 用 于 从 属 线程 间 通 信 的 表 队 列 。 

“ IN-OUT: 并 行 或 分 布 式 操作 间 的 关系 。 


“ PQ Distrib: 在 并 行 操作 中 ， 生 产 者 为 发 送 数 据 给 消费 者 进行 的 分 配 。 


5) 运行 时 统计 (统计 开启 时 可 


Se 


“Starts: 指定 操作 执行 的 次 数 。 


“ Rows: 操作 返回 的 真实 记录 数 。 


:Time: 操作 执行 的 真实 时 间 (HH: MM: SS.FF) 


6) 1/O 统 计 (统计 开启 时 可 


) 
" Buffers: 执行 期 间 进行 的 逻辑 读 操作 数量 。 
* Reads: 


执行 期 间 进 行 的 物理 读 操作 数量 。 


“ Writes: 执行 期 间 进 行 的 物理 写 操作 数量 。 


7) 内 存 使 用 统计 : 


: 0Mem: 最 优 执行 所 需 内 存 的 评估 值 。 
“ 1Mem: 一 次 通过 (one-pass) 执行 所 需 内 存 的 评估 值 。 
“0/1/M: 最 优 /一 次 /多 次 通过 (multipass) 模式 操作 执行 的 次 数 。 


“ Used-Mem: 最 后 一 次 执行 时 操作 使 用 的 内 存量 。 


Used-Tmp: 最 后 一 次 执行 时 操作 使 用 的 临时 空间 大 小 。 这 个 字段 必须 扩大 1024 倍 才能 和 其 他 衡量 内 存 的 字段 一 致 ( 比 如 ，32KB 意 味 着 32MB) 。 


“Max-Tmp: 操作 使 用 的 最 大 临时 空间 大 小 。 这 个 字段 必须 扩大 1024 倍 才能 和 


第 三 部 分 : 


其 他 衡量 内 存 的 字段 一 臻 (比如 ，32KB 意 味 着 32MB) 。 


Query Block Name / Object Alias (identified by operation id) : 
1 - SELS1 
2 - SELS1 / T26SELS1 
3 - SELS1 / T2@SELS$1 
4 - SELS1 / T1@SELS$1 


对 执行 计划 中 的 每 一 步 操作 ， 都 可 以 看 到 所 涉及 的 查询 块 ， 同 时 还 可 能 看 到 相关 的 执行 对 象 。 这 部 分 信息 只 从 10g 才 可 以 使 用 。 


第 四 部 分 : 


Outline Data 


BEGIN OUTLINE DATA 
IGNORE OPTIM FMBEDDED HINTS 

OPTIMIZER FEATURES ENABLE ('10.2.0.3') 
ALL ROWS 二 
OUTLINE LEAF (@"SELS1") 
INDEX RS ASC (@"SELS$1 
FULL (@"SELS1" " $1") 

LEADING (@"SEL$1" "T2"@"SEL$1" "T1"@"SELS$1") 
USE_HASH (@"SEL$1" "T1"@"SELS1") 

END OUTLINE DATA 


nT2"@"sELS1" (nT"."ID") ) 


村 


a 


仅 在 10gR2 后 才 开始 生效 ， 显 示 强 制 产生 一 个 特殊 执行 计划 所 必需 的 一 组 提示 的 集合 。 


第 五 部 分 : 


这 些 提示 的 集合 称 为 提纲 (outline) 。 


Predicate Information (identified by operation id) : 


1 -~ access 
3 - access ( 
4 = filter ("Tl1"," 


显示 使 用 的 谓词 。 对 其 中 的 每 一 个 谓词 ， 显 示 在 第 几 行 和 以 什么 样 的 方式 (访问 或 过 滤 ) 操作 数据 。 
第 六 部 分 : 


Column Projection Information (identified by operation jd) : 


1 - (#keys=1) "T2"."N" [NUMBER, 22], "T2"."ID" [NUMBER，22]， "T2" 
2 - "T2"."ID" [NUMBER, 22] , "T2"."N" [NUMBER, 22], 

3 - "T2".ROWID[ROWID, 10], "T2"."ID" [NUMBER, 22] 

医用 ."N" [NUMBER, 22] 


'. "PAD" [VARCHAR2, 
"T2"."PAD" [VARCHAR2, 1000] 


1000] 


这 部 分 信息 仅 从 10g 开 始 可 用 ， 显 示 每 一 步 操作 执行 时 ， 那 些 字段 作为 输出 返回 。 
第 七 部 分 : 
Note 


- dynamic sampling used for this statement 


提供 优化 阶段 、 环 境 或 5QL 语 句 本 身 的 一 些 注意 和 警告 信息 。 此 处 ， 提 醒 查 询 优化 器 使 用 了 动态 采样 来 收集 对 象 统计 信息 。 在 9iR2 中 ， 这 部 分 内 容 是 没有 标题 的 ， 也 没 包含 多 少 信息 (例如 ， 是 否 使 用 


动态 采样 ) 。 从 10g 开 始 ， 这 部 分 内 容 就 详细 多 了 。 
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定 执行 计划 


在 实际 工作 中 经 常 面临 这 样 一 个 问题 ， 就 是 SQL 语句 的 执行 计划 因为 各 种 原因 


方法 ， 可 以 固定 执行 计划 ， 如 表 3-3 所 示 。 后 面 将 对 各 种 技术 ， 进 行 简单 说明 。 


产生 变化 导致 执行 效率 低下 。 此 时 ， 就 需要 一 种 技术 可 以 将 SQL 语句 的 执行 计划 固定 下 来 。Oracle 数 据 库 本 身 提 供 了 多 种 


表 3-3 Oracle 数据 库 提 供 的 方法 


技术 


是 否 修 改 SQL 


版 本 要 求 


人 
是 人 小、 


月 
下 


所 有 版 本 


存储 概要 否 8i 及 以 上 版 本 
SQL 概要 否 10g 及 以 上 (企业 版 ) 
SQL 计划 基线 否 11g 及 以 上 (企业 版 ) 


通过 使 用 提示 ， 强 制 SQL 语 名 按照 指定 的 方式 执行 。 这 是 一 种 相对 简单 的 处 理 方式 ， 缺 点 是 必须 修改 SQL 语句 ， 且 有 些 情况 下 可 能 会 出 现 忽 略 提示 的 现象 。 关 于 提示 的 使 用 方法 ， 会 在 后 面 详细 说 明 ， 


这 里 指 通过 一 个 简单 的 示例 说 明 一 下 它 的 用 法 。 


SQL> create table tl as select * from dba objects; 
Table created 。 

SQL> alter table tl add primary key (object id) ; 
Table altered. 


SQL> exec sys.dbms stats.gather table stats ('hf', 't1', cascade=>true) ; 


PL/SQL procedure successfully completed. 
SQL> set autotrace on 
SQL> select count (*) from tl1; 

COUNT (*) 


86267 


| Time | 

(0) | 00: 00: 01 1 
| | 

(0) | 00: 00: 01 | 


| Id | Operation | Name | Rows | Cost (%CPU) 
| 0 | SELECT STATEMENT | 1 | 50 
| 1 | SORT AGGREGATE | | | 
| 艺 | INDEX FAST FULL SCAN| SYS C0011089 | 86267 | 50 
SQL> select /*+ full (t1) */ count (*) from 七 1; 
COUNT (*) 
86267 
Execution Plan 
Plan hash value: 3724264953 
| Id | Operation | Name | Rows | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT | | Lh 344 《Wy L000 00505 | 
| 1 | SORT AGGREGATE 1 | 工 | | | 
| | TABLE ACCESS FULL| Tl1 | 86267 | 344 《17 | V0: 00: 05 | 


在 这 个 示例 中 ， 通 过 指定 full 这 个 提示 ， 将 原来 的 “INDEX FAST FULL SCAN” 变 成 了 “TABLE ACCESS FULL” 。 


2. 存 储 概 要 


存储 概要 (stored outlines) 被 设计 用 来 提供 稳定 的 执行 计划 ， 以 消除 执行 环境 或 对 象 统计 信息 的 改变 造成 的 影响 。 这 个 特 | 


加 


性 又 称 计划 稳定 性 。 计 划 稳 定性 阻止 执行 计划 和 应 用 程序 性 能 因 环境 和 配置 


的 改变 而 改变 。 计 划 稳 定性 把 执行 计划 保存 在 存储 概要 中 。 启 用 存储 概要 时 ， 优 化 器 从 概要 中 产生 相应 的 执行 计划 ， 从 而 使 SQL 语句 的 访问 路 径 稳定 下 来 。 存 储 概要 中 的 计划 不 会 改变 ， 即 使 数据 库 配 置 或 
程序 性 能 。 要 使 用 存储 概要 ， 执 行 的 SQL 语句 应 与 存储 的 SQL 语句 完全 匹配 。 执 行 


Oracle 版 本 发 生变 化 。 计 划 稳 定性 还 可 以 在 从 基于 规则 优化 器 移植 到 基于 成 本 优化 器 时 和 升级 到 新 版 本 Oracle 时 稳定 应 
计划 的 固定 依赖 于 当 判 定 一 个 查询 是 否 存在 存储 概要 时 查询 语句 是 否 完全 一 致 ， 与 判定 shared pool 里 一 个 执行 计划 是 否 可 以 重 


时 的 匹配 方式 是 一 致 的 。 下 面 通过 一 个 简单 的 示例 说 明 具 体 用 法 。 


SQL> create table t as select * from dba objects; 
Table created. 

SQL> set autotrace on 

SQL> select * from t where object id=10; 


Id Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
0 SELECT STATEMENT | 14 | 2898 | 344 (1) | 00: 00: 05 
帮主 TABLE ACCESS FULL| 了 | 14 | 2898 | 344 Cy | O00: V0 05 | 
SQL> create index idx t on t (object id) ; 
Index created. 
SQL> select * from 七 where object iqd=10; 
I Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
0 SELECT STATEMENT | | El 207 | 2 (0) | 00: 001 
本 TABLE ACCESS BY INDEX RONID 
| | | 207 | 全 (0) | 00: 001 
才 亚 INDEX RANGE SCAN 1 30% | | | 1 (0) 00: 001 


在 有 索引 的 情况 下 ， 这 条 语句 走 的 “INDEX RANGE SCAN”; 没有 索引 的 情况 下 ， 走 的 是 “TABLE ACCESS FULL” 。 


SQL> drop index idx t; 
Index dropped. 


SQL> create or replace outline myoutline for category mycategory on 


select * from t where object id=10; 
Outline created. 


在 没有 索引 的 情况 下 ， 为 这 条 语句 生成 一 个 存储 概要 。 


SQL> create index idx t on t (object id) ; 
Index created. 
SQL> select * from t where object_id=10; 


(8sCPU) | Time | 


(0) | 00: 001 
(0) | 00: 001 
(0) | 00: 001 


| Id | Operation | Name | Rows | Bytes | Cost 
i AE | 
| 0 | SELECT STATEMENT | | | 207 | 2 

| 1 | TABLE ACCESS BY INDEX ROWID| T | 工 | 207 | 2 

| 二 有 | INDEX RANGE SCAN | IDXT | 1 | [ 1 

SQL> alter session set use stored outlines=mycategory; 

Session altered. 

SQL> select * from 七 where object igd=10; 

| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time 


| 0 | SELECT STATEMENT | 1 T1929 1 208K| 344 (1) | 00: 00: 05 | 
I* 1 | TABLE ACCESS FULL| T | 1029 | 208K| 344 CO | D0 WO 05 | 


- outline "MYOUTLINE" used for this statement 


在 会 话 级 使 用 先前 定义 的 存储 概要 ， 在 即使 有 索引 的 情况 下 ， 仍 然 走 的 是 “TABLE ACCESS FULL”。 需 要 特别 关注 的 是 ， 后 面 的 Note 一 节 ， 明 确 说 明了 这 个 语句 使 用 了 名 称 为 “MYOUTLINE” 的 存 
储 概要 。 
3.SQL 概 要 


SQL 概要 是 一 个 对 象 ， 它 包含 了 可 以 帮助 查询 优化 器 为 一 个 特定 的 SQL 找到 高 效 执行 计划 的 信息 。 这 些 信 息 包 括 执行 环境 、 对 象 统计 和 对 查询 优化 器 所 做 评估 的 修正 信息 。 它 最 大 的 优点 是 在 不 修改 SQL 
和 会 话 执行 环境 的 情况 下 影响 查询 优化 器 的 决定 。 下 面 通过 一 个 简单 示例 说 明 一 下 它 的 用 法 。 


下 面 的 代码 准备 了 一 个 数据 环境 。 


SQL> create table tl1 as select rownum as id, 七 .* from dba objects 七 ; 
Table created. 本 

SQL> create index idx tl on tl (id) ; 

Index created. Cn 

SQL> exec dbms stats.gather table stats (user, 'T1') ; 

PL/SQL procedure successfully completed. 


按照 下 面 的 查询 ,检索 一 部 分 数据 ， 执 行 计划 走 的 是 索引 范围 扫描 。 


SQL> set autotrace traceonly exp 
SQL> select count (*) from tl1 where id<100; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT | | | | 2 (0) | 00: 00: 01 1 
[ 1 | SORT AGGREGATE | 1 11 -a | 

| 蔚 INDEX RANGE SCAN| IDX T1 | 99 1 495 1 2 (0) 00: 00: 01 


下 面 的 代码 使 用 了 full 提 示 ， 模 拟 了 一 个 性 能 较 差 的 SQL 语 句 ， 使 用 了 全 表 扫 描 的 方式 检索 数据 。 下 面 尝试 使 用 SQL 概 要 的 方式 解决 这 个 问题 。 


SQL> select /*+ full (t) */ count (*) from tl 七 where idq<100; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT | | 中 1) 361 《0 
| 1 | SORT AGGREGATE | | 二 :| | | 

| 二 受 | TABLE ACCESS FULL| T1 | :> 和 州 361 | 


使 用 下 面 的 方法 ， 可 生成 一 个 SQL 概要 。 可 以 按照 输出 报告 的 方法 ， 接 受 一 个 SQL 概要 。 


SQL> set autotrace off 
SQL> declare 
2 V task name varchar2 (30) ; 
3 begin 
4 V task name: =dbms sqltune.create tuning task (sql text=>'select /*+ full (t) */ count (*) from tl t where id<100', task name=>'task t1') ; 
5 dbms_ sqltune.execute tuning task (v task name) ; 
6 dbms output.put line (v task name) ; 加 
7 end; 
上 六 
PL/SQL Procedure successfully completed. 
select dbms_sqltune.report tuning task ('task t1') from dual; 
GENERAL INFORMATION SECTION 


Tuning Task Name : task 七 1 

Tuning Task Owner : Er 

Scope : COMPREHENSIVE 

Time Limit (seconds) : 1800 

Completion Status : COMPLETED 

Started at : 12/10/2010 17: 18: 03 
Completed at ; 12/10/2010 17:; 18; 03 
Number of SQL Profile Findings 人 


Schema Name: HF 
SQL ID 3k0zyqls87nuc 
SQL Text select /*+ full (t) */ count (*) from tl t where id<100 


FINDINGS SECTION (1 finding) 


1- SQL Profile Finding (see explain plans section below) 


// 找 到 一 个 SQL Profile， 具 体 的 执行 计划 在 下 面 


A potentially better execution plan was found for this statement. 
Recommendation (estimated benefit: 98.78%) 
- Consider accepting the recommended SQL profile. 
execute doms_sqltune.accept sql profile (task name => 'task t1', replace => TRUE) ; 
// 采 用 这 个 SQL Profile， 只 需要 执行 这 个 即 可 


1- Original With Adjusted Cost 
// 原 始 的 执行 计划 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT | | 二 | 5 ] 165 (2) | 00: 00: 02 | 
| 1 | SORT AGGREGATE | | 工 | -| | | 
[Ear TABLE ACCESS FULL| T1 | 96 | 480 | 165 2) | O00: 00: O21 


Predicate Information (identified by operation id) : 
2 - filter ("ID"<100) 

2- Using SQL Profile 

// 使 用 SQL Profile 后 的 执行 计划 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT | | | -| 2 0) | 00: 0:,01 1 
| 1 | SORT AGGREGATE | | 二 .省 | | | 

号. 次 | INDEX RANGE SCAN| IDX T1 | 96 | 480 | 2 (0) | 00: 00: 01 | 


Predicate Information (identified by operation id) : 


品 
里 


下 面 的 操作 接受 了 这 个 SQL 概要 。 


然 在 SQL 代码 中 存在 提示 ， 但 Oracle 优 化 器 还 是 会 根据 SQL 概要 选择 更 合适 的 执行 计划 。 在 执行 计划 的 Note 部 分 ， 标 明了 使 


了 SQL 概要 。 


SQL> execute dbms_sqltune.accept_sql_ profile (task name => "task t1', 
PL/SQL procedure successfully completed. 

SQL> set autotrace traceonly exp 
SQL> select /*+ full (t) */ count (*) 


replace => TRUE) ; 


from tl1 七 where id<100; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT | | | 号 下 2 (0) | 00: 00: 01 1 
| 1 | SORT AGGREGATE | | | -| | | 

| 二- 莹 寺 INDEX RANGE SCAN| IDX T1 | 99 1 495 | 2 (0) | 00: 00: 01 | 
Note 


- SQL profile “SYS SQLPROF 01498bec08ca0000" used for this statement 


4.SQL 计 划 基 线 


从 119 开 始 ， 存 储 概 要 被 SQL 计划 基线 取而代之 。 可 以 认为 SQL 计划 基线 是 存储 概要 的 一 个 改进 版 本 。SQL 计 划 基 线 是 一 个 与 SQL 语句 相 关联 的 对 象 ， 它 被 设计 
条 给 定 的 SQL 语 句 产生 一 个 特定 的 、 稳 定 的 执行 计划 。SQL 计 划 基 线 是 存储 在 数据 字典 中 的 。 


具体 来 说 ，SQL 计 划 基 线 主要 是 一 个 提示 的 集合 。 基 本 上 ，SQL 计 划 基 线 就 是 用 来 迫使 查询 优化 器 给 一 


下 面 通过 一 个 示例 ， 说 明 一 下 SQL 计 划 基 线 的 使 用 方法 。 


下 面 的 代码 准备 了 一 个 数据 环境 。 


影响 查询 优化 器 产生 执行 计划 时 的 决 


SQL> create table tl1 as select rownum as id, 七 .* from dba objects 七 ; 
Table created. 加 

SQL> create index idx tl on tl (id) ; 

Index created. 加 

SQL> exec dbms_stats.gather table stats (User，'T1') ; 

PL/SQL procedure successfully completed. 


按照 下 面 查询 ， 检 索 一 部 分 数据 ， 执 行 计划 走 的 是 索引 范围 扫描 。 


SQL> set autotrace on explain 
SQL> select count (*) from tl where id between 100 and 200; 


| Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 

| 0 SELECT STATEMENT | | | | 2 (0) | 00: 00: 01 | 
| 1 SORT AGGREGATE ]} | 11 5 | | | 
[4 INDEX RANGE SCAN| IDX T1 | 102 | 510 2 (0) | 00: 00: 01 | 


下 面 使 


了 full 提 示 ， 模 拟 了 一 个 性 能 较 差 的 SQL 语句 ， 使 


了 全 表 扫 描 的 方式 检索 数据 。 下 面 尝试 使 


回 


SQL 计划 基线 的 方式 解决 这 个 问题 。 


SQL> select /*+ full (t) */ count (*) from tl t where id between 100 and 200; 


| Td Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 

| 0 SELECT STATEMENT | | 二 S| 361 《1 | 00: 00: V5 1 
| 1 SORT AGGREGATE | | 1 -| | 

| 二 各 TABLE ACCESS FULL| T1 | 102 | 510 | 361 | 


下 面 的 操作 接受 了 这 个 SQL 计划 基线 。 虽 然 在 SQL 代码 中 存在 提示 ， 但 Oracle 优 化 器 还 是 会 根据 SQL 计划 基线 选择 更 合适 的 执行 计划 。 在 执行 计划 的 Note 部 分 ， 标 明了 使 用 了 SQL 计划 基线 。 
SQL> set autotrace off 
SQL> alter session set optimizer capture sql plan baselines = true; 
Session altered. 
SQL> select /*+ full (t) */ count (*) from tl t where id between 100 and 200; 
SQL> select /*+ full (t) */ count (*) from tl t where id between 100 and 200; 
SQL> alter session set optimizer capture sql Plan baselines=false; 
Session altered. 
SQL> select /*+ full (t) */ count (*) from tl t where id between 100 and 200; 
SQL> select * from table (dbms xplan.display cursor) ; 
| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT | | | | 361 (100) | | 
| 1 | SORT AGGREGATE | | > -| | | 
位 次 ] TABLE ACCESS FULL| T1 | 102 | 510 | 361 《1 | V0 O00: V5 1 
Note 
- SQL Plan baseline SQL PLAN bgn8rnrj73kjc616acf47 used for this statement 
3.3.3 ”修改 执行 计划 
修改 执行 计划 的 方法 很 多 ， 这 里 以 SQL 概要 为 例 进行 说 明 。 其 原理 是 构造 一 个 与 原始 SQL 在 逻辑 上 、 结 构 上 完全 相同 的 SQL。 强 制 逻辑 上 和 结构 上 相同 ，SQL 解 析 的 用 户 名 、SQL 中 引用 对 象 的 用 户 名 甚 


至 是 一 些 谓词 条 件 都 可 以 不 同 。 当 然 能 够 完全 一 样 会 更 省 
这 种 方法 。 


有 。 然后 执行 构造 的 SQL， 并 取得 构造 SQL 的 概要 数 所 


下 面 的 代码 进行 了 一 些 数据 准备 工作 。 


居 。 使 用 原始 SQL 的 文本 和 构造 SQL 的 概要 数据 创建 一 个 SQL Profile。 下 面 通过 一 个 示例 说 明 


SQL> create table tl as select * from dba objects; 
Table created. 

SQL> create table t2 as select * from dba objects; 
Table created. 

SQL> create index idx t2 on t2 (object id) ; 

Index created. 

SQL> exec dbms_stats.gather table stats (sep ?TET 
PL/SQL procedure successfully completed. 

SQL> exec dbms stats.gather table stats (user, 'T2') ; 
PL/SQL procedure successfully completed. 


我 们 生成 了 一 个 “原始 ”SQL， 它 的 执行 计划 走 的 是 哈 希 连接 。 
SQL> select /*+ orig sql full (t1) full (t2) use hash (tl t2) */ tl1.*, t2.0wner from t1, t2 


2 where tl.object name like '%T1%' and tl1.object igd=t2.o0object id; 
SQL> select sql id, child number, plan hash value 

2 from v$sqgl 园 

3 where sql text like '%orig sql%' and sql text not like '%v$sql%'; 
SQL ID CHILD NUMBER PLAN HASH VALUE 


8s5ddx4hhwzwp 0 1838229974 
SQL> select * from table (dbms xplan.display cursor ('8s5ddx4hhwzwp', 0) ) ; 


| Id | Operation | Name | Rows | Bytes | Cost 

| 0 | SELECT STATEMENT | | | 688 
I* 1 | HASH JOIN | 4314 | 459K| 688 
Is 晕 |] TABLE ACCESS FULL| T1 | 4314 | 412K| 344 
| :| TABLE ACCESS FULL| T2 | 86273 | 926K| 344 


下 面 的 代码 生成 了 一 个 “构造 ”SQL,， 它 的 执行 计划 走 的 是 嵌 套 扫描 。 


SQL> select /*+ modify sql index (t1) index (t2) use nl (tl t2) */ tl1.*, t2.0owner from tl1，t2 
2 where tl.object name like '%T1%' and tl1.object id=t2.o0bject id; 

SQL> select sql id, chilgd number, plan hash value 
2 from v$sql 
3 where sql text like '%modify sql%' and sql text not like '%v$sql%®'; 


SQL ID CHILD NUMBER PLAN HASH VALUE 
fyhbm2tj967wk 0 1054738919 
SQL> select * from table (dbms xplan.display cursor ('fyhbm2tj967wk', 0) ) ; 
| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT | | | | 8974 (100) | | 
| 1 | NESTED LOOPS | | 4314 | 459K| 8974 (1) | 00: 01: 48 | 
| | NESTED LOOPS | | 4314 | 459K| 8974 (1) | 00: 01: 48 | 
| 二 可 | TABLE ACCESS FULL | T1 | 4314 | 412K| 344 {17 O02 600: 05 | 
|* 41 INDEX RANGE SCAN | IDX T2 | | | * 《ay 1 0: 002 OL 1 
| :| TABLE ACCESS BY INDEX ROWID 

|] 到 | | | 坚 (0) | 00: 00: 01 | 


下 面 的 代码 生成 “构造 ”SQL 的 SQL Profile。 方 法 是 调用 了 一 个 脚本 一 一 coe_xfr_sql_profile.sql。 附 录 部 分 会 有 这 个 脚本 。 


SQL> @ coe xfr sql profile.sql 

Parameter 1: 

SQL ID (required) 

Enter value for 1: fyhbm2tj967wk 

PLAN_HASH VALUE AVG ET SECS 
1054738919 .096 

Parameter 2: 

PLAN HASH VALUE (required) 

Enter value for 2: 1054738919 

Values passed to coe xfr sql profile: 


SQL ID : "fyhbm2tj967wk" 
PLAN HASH VALUE: "1054738919" 


了 Execute coe xfr sql profile fyhbm2tj967wk 1054738919.sql 
on TARGET system in order to create a custom SQL Profile 
with plan 1054738919 linked to adjusted sql text. 

COE XFR SQL PROFILE completed. 


下 面 的 代码 生成 “原始 ”SQL 的 SQL Profile。 方 法 是 调用 了 一 个 脚本 一 一 coe_xfr_sql_profile.sql。 


SQL>@ coe xfr sql profile.sql 

Parameter 1: 

SQL ID (required) 

Enter value for 1: 8s5ddx4hhwzwp 

PLAN HASH VALUE AVG ET SECS 
1838229974 这 ] 疆 

Parameter 2: 

PLAN HASH VALUE (required) 

Enter value for 2: 1838229974 

Values passed to coe xfr sql profile: 

SQL ID 8s5ddx4hhwzwp" 

PLAN HASH VALUE: "1838229974" 


Execute coe xfr sql profile 8s5ddx4hhwzwp 1838229974.sql 
on TARGET system in order to create a custom SQL Profile 
with plan 1838229974 linked to adjusted sql text. 

COE, XFR SQL PROFILE completed. 


下 面 的 代码 执行 了 “原始 ”SQL， 其 执行 计划 变 成 “构造 ”SQL 的 执行 方式 。 这 就 达到 了 修改 执行 计划 的 目的 。 


p. 


Coe xfr sql profile 8s5ddx4hhwzwp 1838229974.sql 

: = SYS.5QLPROF ATTR 

BEGIN OUTLINE DATA]', 

IGNORE OPTIM FMBEDDED HINTS]', 

OPTIMIZER FEATURES ENABLE ('11.2.0.4') ]', 

DB VERSION ('11.2.0.4') ]'， 

ALL ROWS]', 

OUTLINE LEAF (@"SELS$1") ] '， 

FULL (Q@™SELS$1" "TI1"@"SEL$1") ]', 

INDEX (@"SELS1" "T2"@" pan OBJECT TD 》 1', 
LEADING (@"SELS1 
USE NL (@"SELS1" "T2"@"SEL$1") ]', 
NLJ BATCHING (@"SELS$1" "T2"@"SEL$1") ]', 

END OUTLINE DATA]') ; 

// 将 SYS .SQLPROF_ATTR 部 分 修改 为 Coe_xfr_ sql profile fyhbm2tj967wk_1054738919.sql 中 的 对 应 部 分 ， 具 体 参 见 上 面 


QQaQamQmQmaQmQaQamaQmaa 口号 


force match => TRUE 

// 由 false 修 改 成 true 

SQL> @ coe xfr sql profile 8s5ddx4hhwzwp_ 1838229974.sql 

select /*+ orig sql full (ti) full (t2) use hash (tl t2) */ tl.*，t2.owner from t1, t2 where tl1.object name like '%T1%' and t1.object id=t2.object id; 


| Bytes | Cost 


| 0 | SELECT STATEMENT en | 4314 | 459K| 8974 (1) DO | 
| 1 | NESTED LOOPS | | 4314 | 459K| 8974 (1) | 00: | 
| 小 ] NESTED LOOPS | | 4314 | 459K| 8974 (1) | 00: | 
| 考 车 TABLE ACCESS FULL | T1 | 4314 | 412K]| 344 {17 1 O0: I 
[这 坑 "] INDEX RANGE SCAN | IDX T2 | | | 1 (0) | 00: | 
| 蒜 让 TABLE ACCESS BY INDEX ROWID 


- SQL profile "coe 8s5ddx4hhwzwp_ 1838229974" used for this statement 


四 除了 最 后 两 个 外 ， 都 要 从 10gR2 起 可 以 使 用 。 


第 4 章 ”统计 信息 


的 。 有 太 多 的 示例 是 


作 ， 以 模拟 应 


Oracle 的 统计 信息 是 存储 在 数据 字典 中 的 一 组 数据 。 它 可 以 从 多 个 维度 描述 存储 在 Oracle 数 据 库 中 的 对 象 或 Oracle 系 统 本 身 的 详细 信息 。 基 
因为 统计 信息 的 缺失 ， 叶 致 优化 器 制定 出 低 效率 的 执行 计划 。 在 进行 SQL 语句 的 优化 工作 中 ， 第 一 步 的 操作 往往 就 是 查看 相关 对 象 的 统计 信息 是 否 完整 、 准确。 


下 面 将 针对 几 类 统计 信息 分 分 别 进行 介绍 。 


统计 信息 分 类 


统计 信息 可 大 致 分 为 系统 统计 信息 、 对 象 统计 信息 、 数 


4.1.1 系统 统计 信息 


Oracle 数 据 库 从 9i 开 始 增加 了 收集 操作 系统 统计 信息 的 功能 。 通 过 收集 到 的 统计 信息 判断 操作 系统 的 CPU、1/O 的 处 理 能 力 。 这 为 优化 器 在 选择 执行 计划 提供 了 额外 的 判断 依据 。 通 过 使 F 
息 ， 人 允许 优化 器 更 加 准确 地 判断 、 评 价 CPU 和 IO 代价 ， 选 择 更 好 的 查询 计划 。 根 据 度量 MO 子 系统 的 方法 不 同 ， 可 将 系统 统计 信息 分 为 两 类 : 


' 非 工作 量 统计 信息 (noworkload statistics) ; 


' 工作 量 统计 信息 (workload statistics) 。 


这 两 者 的 区 别 是 ， 前 者 是 使 用 人 工 基准 测试 ， 后 者 使 用 应 用 程序 基准 测试 。 这 里 解释 一 下 ， 所 谓 人 工 基准 测试 是 指 并 非 实 际 运 行 的 程序 产生 的 工作 量 。 人 工 基准 测试 的 


于 成 本 的 优化 器 正 是 利 


届 字 典 统计 信息 、 内 部 对 象 统 计 信息 等 ， 下 面 分 别 介绍 。 


了 统计 信息 ， 来 分 析 生 成 执行 计划 


要 目的 是 通过 执行 近似 的 操 


1. 指 标 项 说 明 


程序 的 负载 。 虽 然 能 够 以 轻易 可 控 的 方式 运行 ， 但 通常 情况 下 无 法 产生 像 应 用 程序 基准 测试 那么 好 的 性 能 数据 。 所 谓 应 
。 通 常 可 以 很 好 地 提供 实际 运行 系统 的 性 能 信息 。 关 于 收集 方法 ， 后 面 会 有 专门 说 明 。 下 面 对 系 统统 计 信息 项 加 以 说 明 。 


非 工 作 量 统计 信息 和 工作 量 统计 信息 这 两 类 所 包含 的 指标 不 同 ， 在 计算 时 会 进行 一 定 的 换算 。 


(1) 非 工 作 量 统计 信息 


从 10g 开 始 ， 非 工作 量 统计 信息 总 是 可 用 的 ， 


其 主要 包含 以 下 指标 项 : 


: CPUSPEEDNW: 代表 无 负载 CPU 速度 。CPU 速 度 为 每 秒 CPU 周期 数 ， 也 就 是 一 个 CPU 一 秒 能 处 理 的 操作 数 ， 单 位 是 百 万 次 / 秒 。 
“ IOSEEKTIM: I/O 查 找 时 间 ， 也 就 是 平均 寻 道 时 间 ， 其 等 于 查找 时 间 、 延 迟 时 间 、OS 负 载 时 间 三 者 之 和 ， 单 位 为 毫秒 ， 默 认为 10。 


“ IOTFRSPEED: IO 传输 速 度 ， 也 就 是 平均 每 毫秒 从 磁盘 传输 的 字 节 数 ， 单 位 为 字 节 /毫秒 ， 默 认为 4096。 


(2) 工作 量 统计 信息 


工作 量 统计 信息 只 有 在 显 式 地 收集 以 后 才 可 


计时 一 样 。 工 作 量 统计 信息 主要 包含 以 下 指标 项 : 


“ CPUSPEED: 代表 有 负载 CPU 速度 。CPU 速 度 为 每 秒 CPU 周期 数 ， 也 就 是 一 个 CPU 一 秒 能 处 理 的 操作 数 ， 单 位 是 百 万 次 / 秒 。 


。 要 进行 显 式 收集 ， 就 不 能 使 用 空闲 的 系统 ， 因 为 数据 库 引擎 要 利 


程序 基准 测试 是 指 基于 实际 应 


“SREADTIM: 随机 读 取 单 块 的 平均 时 间 ， 单 位 为 毫秒 。 


“ MREADTIM: 顺序 读 取 多 块 的 平均 时 间 ， 也 前 


就 是 多 块 平均 读 取 时 间 ， 单 位 为 毫秒 。 


" MBRC: 平均 每 次 读 取 的 块 数量 ， 单 位 为 块 数 。 


" MAXTHR: 最 大 1/O 〇 吞吐 量 ， 单 位 字 节 / 秒 。 


“ SLAVETHR: 并 行 处 理 中 从 属 线 程 的 平均 I/ 〇 吞吐 量 ， 单 位 字 节 / 秒 。 


2 数据 字典 统计 信息 查询 


居 库 负载 来 评估 MO 子 系统 。 另 一 方面 ， 衡 量 CPU 速 度 的 方法 与 进行 非 工作 统 


系统 统计 信息 保存 在 aux_stats 表 里 面 。Oracle 没 有 提供 数据 字典 视图 来 供 外 部 表 访 问 。 我 们 可 以 通过 对 这 个 内 表 的 访问 ， 了 解 系统 统计 信息 各 个 方面 的 情况 。 例 如 下 


集 的 时 间 及 状态 。 


[sys@testdb] SQL> col pval2 format a20 
[sys@testdb] SQL> select pname, pvall, pva 
2 fromsys.aux stats$ 

3 wheresname='SYSSTATS INFO'; 

PNAME, PVAL1 


STATUS 


12 


PVAL2 


08-24-2013 12: 04 
08-24-2013 12: 04 


COMPLETED 


如 果 收 集 是 正确 的 ， 则 显示 为 COMPLETED 状 态 。 下 面 的 命令 可 查询 系统 统计 信息 的 结果 集 。 


[sys@testdb] SQL> select pname, pvall from sys.aux stats$ where sname="'SYSSTATS MAIN'; 


PNAME, PVAL1 
CPUSPEED 

CPUSPEEDNW 3074.07407 
IOSEEKTIM 10 
IOTFRSPEED 4096 
MAXTHR 

MBRC 

MREADTIM 

SLAVETHR 

SREADTIM 


3. 相 关 操 作 


针对 系统 统计 信息 ， 可 以 有 多 种 操作 ， 下 面 简 和 


说 明 一 下 。 


程序 正常 操作 产生 的 工作 量 进行 


的 命令 ， 可 查看 系统 统计 信息 收 


(1) 收集 统计 信息 


针对 非 工作 量 和 工作 量 的 统计 信息 ， 收 集 的 方法 是 不 同 的 。 针 对 非 工作 量 的 系统 统计 信息 ， 可 采用 如 下 方法 收集 : 


dbms_stats.gather system stats (gathering mode=>'noworkload') ; 


针对 工作 量 的 统计 信息 ， 可 使 用 多 种 方法 进行 收集 。 一 种 方法 是 ， 执 行 两 次 收集 动作 ， 在 两 次 快照 之 间 计 算 其 差 值 。 具 体 方法 参考 如 下 : 


dbms_stats.gather _ system stats (gathering mode=>'start') ; 
wait a moment 
dbms_stats.gather system stats (gathering mode=>'stop') ; 


这 里 关于 等 待 时 间 需 要 注意 ， 数 据 库 引 擎 并 不 控制 数据 库 负 载 ， 因 此 必须 等 待 足够 的 时 间 来 产生 一 个 有 代表 性 的 负载 之 后 再 进行 男 一 次 快照 ， 一 般 等 待 至 少 30 分 钟 。 


另 一 种 方法 是 ， 这 种 方式 会 立即 启动 收集 一 个 快照 ， 而 第 二 次 收集 快照 动作 在 指定 时 长 后 执行 。 这 个 处 理 过 程 并 不 会 一 直 持续 ， 它 会 通过 系统 的 调度 工具 完成 。 


dbms_stats.gather system stats (gathering mode=>'interval'， interval=>N) ; 
* 上 述 过 程 中 ， 参 数 interval 就 是 指定 收集 间隔 时 长 


(2) 设置 统计 信息 


除了 利用 上 面 方法 收集 系统 统计 信息 外 ， 还 可 以 手工 设置 系统 统计 信息 。 但 一 般 不 建议 这 样 做 ， 有 一 定 操作 风险 。 手 工 设置 系统 统计 信息 如 下 : 


begin 

dbms_stats.delete system stats () ; 

dbms_ stats.set system stats (pname=>'CPUSPEED', pvalue=>772) ; 
dbms_ stats.set system stats (pname=>'SREADTIM', pvalue=>5.5) ; 
dbms stats.set system stats (pname=>'MREADTIM', pvalue=>19.4) ; 
dbms stats.set system stats (pname=>'MBRC', pvalue=>53) ; 
dbms_stats.set_ system stats (pname=>'MAXTHR', pvalue=>1243434334) ; 
dbms_stats.set_ system stats (pname=>'SLAVETHR', pvalue=>1212121) ; 
end; 


(3) 删除 统计 信息 


如 果 感觉 系统 收集 的 统计 信息 有 问题 ， 也 可 以 采用 下 面 方式 进行 删除 。 


execdbms_stats.delete system stats; 


4. 系 统统 计 信 息 对 优化 器 的 影响 


系统 统计 信息 会 直接 影响 优化 器 的 成 本 计算 。 如 果 存 在 工作 量 统计 ， 则 优化 器 会 使 用 它 而 忽略 非 工 作 量 统计 信息 。 如 果 工 作 量 统计 信息 不 正确 ， 那 么 数据 库 会 使 用 非 工 作 量 统计 信息 。 但 要 注意 ， 查 询 
优化 器 会 运行 一 些 健康 检查 ， 可 能 禁用 或 部 分 替换 工作 量 统计 信息 。 


在 未 引入 系统 统计 信息 之 前 ，CBO 所 计算 的 成 本 值 全 部 是 基于 I/O 来 计算 的 ; 在 Oracle 引 入 了 系统 统计 信息 之 后 ， 实 际 上 就 额外 地 引入 了 CPU 成 本 计算 模型 。 从 此 之 后 ，CBO 所 计算 的 成 本 值 就 不 再 仅 
仅 包 含 VO 成 本 ， 而 是 包含 MO 成 本 和 CPU 成 本 两 部 分 。CBO 在 计算 成 本 的 时 候 就 会 分 别 对 它们 进行 计算 ， 并 将 计算 出 的 MO 成 本 和 CPU 成 本 值 的 总 和 作为 目标 SQL 的 新 成 本 值 。 


4.1.2 ”对 象 统计 信息 


1. 表 统计 信息 


表 是 数据 库 里 最 基础 的 对 象 。 下 面 通过 一 个 简单 例子 ， 看 看 表 都 有 哪些 常见 的 统计 信息 。 


在 下 面 的 例子 中 ， 我 们 手工 创建 了 一 个 表 ， 然 后 收集 了 相关 统计 信息 。 最 后 查看 数据 字典 ， 得 到 相关 的 统计 信息 。 


[hf@testdb] SQL> create table tl as select * from dba objects; 

Table created. Wl 

[hf@testdb] SQL> exec dbms stats.gather table stats (user, 't1') ; 

PL/SQL procedure successfully completed. 加 

[hf@testdb] SQL> select table name, num rows, blocks, empty blocks, avg_space, 
chain cnt, avg row len 

2 fromuser tablest 

3 wheretable name="'T1'; 


TABLE NAME NUM ROWS © BLOCKS EMPTY BLOCKS AVG SPACE CHAIN CNT AVG ROW_LEN 
un 86273 1260 0 0 0 98 
其 中 统计 信息 的 含义 如 下 : 


* num_rows; 数据 的 行 数 。 

“ blocks: 高 水 位 线 下 的 数据 块 个 数 。 

“ empty_blocks: 高 水 位 线 以 上 的 数据 块 个 数 。dbms_stats 不 计算 这 个 值 ， 被 设置 为 0。 
.avg space: 数据 块 中 平均 空余 空间 ( 字 节 ) 。dbms_stats 不 计算 这 个 值 ， 被 设置 为 0。 
“ chain_cnt: 行 链接 和 行 迁 移 的 数目 。dbms_stats 不 计算 这 个 值 ， 被 设置 为 0。 

-avg row_len: 行 平均 长 度 ( 字 节 ) 。 


(1) 高 水 位 线 


我 们 在 前 面 表 的 统计 信息 中 可 以 看 到 一 个 概念 一 一 高 水 位 线 (HWM) ， 这 是 一 个 比较 重要 的 概念 。 当 我 们 开始 向 表 插入 数据 时 ， 第 1 个 块 已 经 放 不 下 后 面 新 插入 的 数据 。 此 时 ，Oracle 将 高 水 位 线 之 上 
的 块 用 于 存储 新 增 数据 ， 同 时 ， 高 水 位 线 本 身 也 向 上 移 。 也 就 是 说 ， 当 不 断 插入 数据 时 ， 高 水 位 线 会 不 断 上 移 。 这 样 ， 在 高 水 位 线 之 下 的 ， 就 表示 使 用 过 的 块 ;高 水 位 线 之 上 的 ， 就 表示 已 分 配 但 从 未 使 
过 的 块 。 高 水 位 线 在 插入 数据 时 ， 当 现 有 空间 不 足 而 进行 空间 的 扩展 时 会 向 上 移 ， 但 删除 数据 时 不 会 下 移 。Oracle 不 会 释放 空间 以 供 其 他 对 象 使 用 。 


Oracle 的 全 表 扫 描 是 读 取 高 水 位 线 以 下 的 所 有 块 。 当 发 出 一 个 全 表 扫 描 时 ，Oracle 始 终 必 须 从 段 一 直 扫描 到 高 水 位 线 ， 即 使 它 什 么 也 没有 发 现 。 该 任务 延长 了 全 表 扫 描 的 时 间 。 下 面 通过 一 个 示例 说 明 


一 下 . 


[hf@testdb] SQL> create table tl as select * from dba objects; 

Table created. 

[hf@testdb] SQL> insert into tl1 select * from t1; 

86274 rows created. 

[hf@testdb] SQL> insert into tl1 select * from 七 1; 

172548 rows created. 

[hf@testdb] SQL> insert into tl1 select * from t1; 

345096 rows created. 

[hf@testdb] SQL> commit; 

Commit complete. 

[hf@testdb] SQL> exec dbms stats.gather table stats (user, 't1') ; 

PL/SQL procedure successfully completed. 

[hf@testdb] SQL> exec sys.show space ('t1', 'auto') ; 

Total Blockshttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/. .http://www.hzcourse.com/resource/readBook?path=/openresour 
Total Byteshttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/..http://www.hzcourse.com/resource/readBook?path=/openresourc 
Unused Blockshttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/. .http://www.hzcourse.com/resource/readBook?path=/openresotr 
Unused Byteshttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/O0EBPS/Text/. .http://www.hzcourse.com/resource/readBook?path=/openresour 
Last Used Ext FileIdhttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0OEBPS/Text/..http://www.hzcourse.com/resource/readBook?path=/oF 
Last Used Ext BlockIdhttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/. .http://www.hzcourse.com/resource/readBook?path=/c 
Last Used Blockhttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/. .http://www.hzcourse.com/resource/readBook?path=/openres 
PL/SQL procedure successfully completed. 


这 里 使 用 了 一 个 自 定义 的 过 程 show_space， 其 具体 定义 可 以 在 网 上 搜 到 ， 这 里 不 再 袭 述 。 通 过 这 个 方法 可 以 观察 到 一 个 表 的 空间 使 用 情况 ，HWM 的 计算 公式 为 : HWM=Total Blocks-Unused 
Blocks。 针 对 上 例 ， 其 高 水 位 线 就 是 10240。 


下 面 的 语句 执行 了 一 个 全 表 扫 描 。 通 过 之 前 的 说 明 可 知 ， 数 据 库 会 扫描 高 水 位 线 下 的 全 部 数据 块 。 对 应 的 统计 信息 consistent gets 和 physical reads 可 见 。 


[hf@testdb] SQL> set autotracetraceonly 
[hf@testdb] SQL> select count (*) from tl1; 


| Id | Operation | Name | Rows | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT | | 1 | 2749 4 二 112002065 33 1 
| 1 | SORT AGGREGATE | | 1 1 | | 

| | TABLE ACCESS FULL| Tl1 | 690K| 2749 《100 0s 33 7 


9881 consistent gets 
9873 physical reads 


讽 除 数据 后 ， 重 复 下 面 的 行为 ， 从 输出 可 见 其 consistent gets 变 化 不 大 ，physical reads 减 少 是 因为 数据 块 被 缓存 的 关系 。 


hf@testdb] SQL> set autotrace off 
hf@testdb] SQL> delete from tl1; 

690192 rows deleted. 

hf@testdb] SQL> commit; 

Commit complete. 

hf@testdb] SQL> set autotracetraceonly 
hf@testdb] SQL> select count (*) from tl1; 


Id | Operation | Name | Rows | Cost (%CPU) | Time | 
0 | SELECT STATEMENT 1 | i. 2749 (1) | 00: 00: 33 | 
1 | SORT AGGREGATE | | | | | 
| TABLE ACCESS FULL| T1 | 690K| 2749 (1) | 00: 00: 33 | 


9888 consistent gets 
2484 physical reads 


此 时 ， 查 看 其 高 水 位 线 ， 没 有 变化 。 也 就 是 说 ，delete 操 作 不 会 降低 高 水 位 线 。 


[hf@testdb] SQL> set autotrace off 

[hf@testdb] SQL> exec sys.show space ('t1', 'auto') ; 

Total Blockshttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/. .http://www.hzcourse.com/resource/readBook?path=/openresour 
Total Byteshttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/..http://www.hzcourse.com/resource/readBook?path=/openresourc 
Unused Blockshttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/..http://www.hzcourse.com/resource/readBook?path=/openresov 
Unused Byteshttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/. .http://www.hzcourse.com/resource/readBook?path=/openresour 
Last Used Ext FileIdhttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/..http://www.hzcourse.com/resource/readBook?path=/oF 
Last Used Ext BlockIdhttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/. .http://www.hzcourse.com/resource/readBook?path=/c 
Last Used Blockhttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/. .http://www.hzcourse.com/resource/readBook?path=/openres 
PL/SQL procedure successfully completed. 


Truncate 操 作 后 ， 整 体 读 取 的 数据 块 减少 了 。 原 因 就 是 其 高 水 位 线 下 降 了 ， 从 原来 的 10240 到 现在 的 8-5) 。 因 为 扫描 的 数据 块 少 了 ， 因 此 其 一 致 性 读 、 物 理 读 指标 也 下 降 了 。 


hf@testdb] SQL> truncate table tl1; 

Table truncated. 

hf@testdb] SQL> set autotracetraceonly 
hf@testdb] SQL> select count (*) from tl1; 


Id | Name | Rows | Cost (%CPU) | Time | 
0 | SELECT STATEMENT 1 | 1 | 2749 (1) | 00: 00: 33 | 
1 | SORT AGGREGATE | | 下 | 
2 | TABLE ACCESS FULL| T1 | 690K| 2749 (1) | 00: 00: 33 | 
Statistics 


7 consistent gets 

0 physical reads 

hf@testdb] SQL> set autotrace off 

hf@testdb] SQL> exec sys.show space ('t1l', 'auto') ; 

Total Blockshttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/. .http://www.hzcourse.com/resource/readBook?path=/openresour 
Total Byteshttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/..http://www.hzcourse.com/resource/readBook?path=/openresourc 
Unused Blockshttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/..http://www.hzcourse.com/resource/readBook?path=/openresov 
Unused Byteshttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/. .http://www.hzcourse.com/resource/readBook?path=/openresour 
Last Used Ext FileIdhttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/..http://www.hzcourse.com/resource/readBook?path=/oF 
Last Used Ext BlockIdhttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/. .http://www.hzcourse.com/resource/readBook?path=/c 
Last Used Blockhttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/. .http://www.hzcourse.com/resource/readBook?path=/openres 
PL/SQL procedure successfully completed. 


(2) 临时 表 


临时 表 是 一 类 特殊 的 数据 对 象 ， 其 很 多 行为 与 普通 表 不 同 。 对 于 数据 库 来 说 ， 有 两 种 临时 表 : 一 种 是 基于 会 话 (on commit preserve rows) 的 临时 表 ; 一 种 是 基于 事务 (on commit delete rows) 
的 临时 表 。 无 论 是 基于 事务 还 是 基于 会 话 的 临时 表 ， 对 于 其 他 会 话 都 是 不 可 见 的 。 换 句 话说 ,数据 只 存在 于 当前 会 话 中 。 基 于 事务 的 临时 表 ， 在 本 会 话 中 只 要 有 提交 动作 ， 数 据 就 会 立即 消失 ;基于 会 话 的 
临时 表 在 SESSION 生存 期 内 提交 数据 仍然 存在 ， 并 且 可 以 回 滚 ， 没 退出 会 话 之 前 和 普通 表 的 操作 没有 什么 区 别 。 


针对 临时 表 而 言 ， 默 认 是 不 收集 统计 信息 的 ， 可 以 使 用 dbms_stats.gather_schema_stats 这 个 过 程 来 收集 ， 但 是 需要 修改 属性 gather tmp 的 值 ， 将 其 由 默认 的 false， 修 改 为 true。 在 收集 统计 信息 
时 ， 最 终 的 统计 信息 是 最 后 一 个 执行 收集 动作 的 会 话 所 能 看 到 的 数据 。 不 过 需要 注意 的 是 ， 可 以 统计 基于 会 话 的 临时 表 ， 不 能 统计 基于 事务 的 临时 表 。 


由 于 临时 表 是 全 局 的 ， 但 收集 的 统计 信息 是 在 某 个 会 话 下 做 的 ， 不 同 会 话 之 问 看 到 的 数据 是 不 同 的 。 因 此 在 使 用 临时 表 时 需要 注意 ， 有 时 收集 统计 信息 反而 会 产生 问题 ， 此 时 可 考虑 走 默认 的 动态 采样 
的 方式 。 


下 面 创 建 了 一 个 基于 会 话 的 临时 表 。 


下 面 通过 一 个 示例 加 以 说 明 。 


[hf@testdb] SQL> create global temporary table t temp2 

2 on commit preserve rows 

3 as select * from dba objects where 1=2; 

Table created. Ee, 

[hf@testdb] SQL> create index idx object id on t temp2 (object id) ; 
Index created. 加 > 


在 一 个 会 话 中 插入 少量 数据 (10 条 ) ， 后 面 简称 为 “会 话 1”。 


[hf@testdb] SQL> select sid from vimystat where rownum=1; 
SID 


20 
[hf@testdb] SQL> insert into t temp2 select * from dba objects where rownum<=10; 
10 rows created. 
[hf@testdb] SQL> commit; 
Commit complete. 


在 一 个 会 话 中 插入 大 量 数 据 (20 万 条 ) ， 后 面 简称 为 “会 话 2”。 


[hf@testdb] SQL> select sid from v$mystat where rownum=1; 

SID 

15 
[hf@testdb] SQL> insert into t temp2 select * from dba objects where rownum<=50000; 
50000 rows created. 
[hf@testdb] SQL> insert into t temp2 select * from dba objects where rownum<=50000; 
50000 rows created. 加 
[hf@testdb] SQL> insert into t temp2 select * from dba objects where rownum<=50000; 
50000 rows created. 加 
[hf@testdb] SQL> insert into t temp2 select * from dba _ objects where rownum<=50000; 
50000 rows created. 本 
[hf@testdb] SOL> commit; 
Commit complete. 


在 “会 话 1” 中 执行 查询 语句 ， 从 输出 中 可 见 ， 这 里 使 用 了 动态 采样 ， 因 为 默认 情况 下 临时 表 是 不 收集 统计 信息 的 。 


[hf@testdb] SQL> select count (*) from t temp2 where object id between 10000 and 50000; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT | | | 13 | 有 0) 4 O00: 00: OF 1 
| 1 | SORT AGGREGATE | 1 | 13 1 | | 
| INDEX RANGE SCAN 

1IDX_ OBJECT_ID]| | | 水 (0) il O00 00: OL | 


Predicate Information (identified by operation id) 


Note 


- dynamic sampling used for this statement (level=2) 
Statistics 
9 recursive calls 
0 db block gets 
9 consistent gets 


在 “会 话 2” 中 执行 查询 语句 ， 从 输出 中 可 见 ， 这 里 也 使 用 了 动态 采样 ， 但 下 面 显示 的 “一 致 性 读 ” 明 显 不 同 ， 这 显然 是 由 于 不 同 会 话 动态 采样 后 分 析 对 象 的 大 小 不 同 。 


[hf@testdb] SQL> select count (*) from t temp2 where object id between 10000 and 50000; 


| Id | Operation | Name | Rows | Bytes Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT 
1 | | 13 163 (0) | 00: 00: 02 | 
| 1 | SORT AGGREGATE 
| 1 工 | 13 | 1 
[| INDEX FAST FULL SCAN 
163 (0) 1 00; 0: V2 1 
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Predicate Information (identified by operation jd) 


Note 
- dynamic sampling used for this statement (level=2) 
Statistics 
0 recursive calls 
0 db block gets 
961 consistent gets 


我 们 在 “会 话 1” 中 收集 了 统计 信息 。 从 后 面 的 查询 可 见 ， 表 的 记录 数 为 10。 这 是 准确 的 ， 因 为 “会 话 1” 能 看 到 的 记录 就 是 10 条 。 


[hf@testdb] SQL> exec dbms stats.gather schema stats ( 'hf', gather temp=>TRUE) ; 
PL/SQL procedure successfully completed. 轩 
[hf@testdb] SQL> select table name, num rows, blocks, chain cnt, avg row_ len, 

global stats, user stats, sample size, to char (t.last analyzed, 'yyyy-mm-dd') aly d 
2 fromdba tables t 册 加 本 加 
3 where owner='HF' and table_name='T_TEMP2 '; 
TABLE NAME NUM ROWS BLOCKS CHAIN CNT AVG ROW LEN GLO USE SAMPIE SIZE ALY D 


T_TEMP2 10 二 0 75 YES NO 10 2014-11-10 


在 “会 话 1” 中 再 次 执行 上 面 的 SQL， 从 输出 可 见 其 执行 计划 不 变 ， 并 且 没 有 动态 采样 的 字样 了 。 此 外 ， 收 集 的 执行 信息 部 分 ， 一 致 性 读 为 1， 这 比 下 面 采 用 动态 采样 获得 的 方式 更 加 精准 。 对 比 下 面 统 


计 信 息 中 的 blocks， 可 以 完全 对 应 上 。 


[hf@testdb] SQL> select count (*) from t temp2 where object id between 10000 and 50000; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time 
| 0 | SELECT STATEMENT| | | 3 1 1 (0) | 00: 00: 01 | 
| 1 | SORT AGGREGATE 

| | 和 3 1 | 1 


[| INDEX RANGE SCAN 
| IDX OBJECT ID | 工 | 二 | 1 Ot v0 00e 0 | 


Predicate Information (identified by operation id) : 


2 - access ("OBJECT ID">=10000 AND "OBJECT ID"<=50000) 
Statistics 
0 recursive calls 
0 db block gets 
1 consistent gets 


在 “会 话 2” 中 重新 查看 一 下 统计 信息 ， 从 中 可 见 看 到 的 还 是 “会 话 1” 收 集 的 状态 。 也 就 是 说 ， 各 个 会 话 看 到 的 数据 是 不 同 的， 但 是 看 到 的 统计 信息 是 一 个 。 


[hf@testdb] SQL> select table name, num rows, blocks, chain cnt, avg_ row len, 

global stats, user stats, sample size, to char (t.last analyzed, 'yyyy-mm-dd') aly d 
2 fromdba tables t S| 
3 where owner='HF' and table name="'T TEMP2'; 
TABLE NAME NUM ROWS BLOCKS “CHAIN CNT AVG ROW LEN GLO USE SAMPLE SIZE ALY D 


T_TEMP2 10 1 0 75 YES NO 10 2014-11-10 
“会 话 2” 重 新 执行 下 面 的 SQL 语句 ， 发 现 其 执行 计划 出 现 了 很 大 偏差 。 从 原 有 的 “INDEX FAST FULL SCAN” 变 化 为 “INDEX RANGE SCAN”。 这 显然 不 是 我 们 希望 看 见 的 ， 由 于 收集 了 临时 表 的 


统计 信息 ， 反 而 造成 了 效率 低下 的 执行 计划 。 


[hf@testdb] SQL> select count (*) from t temp2 where object id between 10000 and 50000; 


| Id | Operation | Name | Rows | Bytes| Cost (%CPU) | Time | 
0 | SELECT STATEMENT | | 4] || 
1 | SORT AGGREGATE | | 工 | 3 1 | | 
1 INDEX RANGE SCAN|IDX OBJECT ID| | :| 


2 - access ("OBJECT ID" 
Statistics 


0 recursive calls 
0 db block gets 
481 consistent gets 


在 “会 话 2” 中 ， 删 除了 统计 信息 ， 执 行 计 划 又 回 到 熟悉 的 “INDEX FAST FULL SCAN”， 后 面 又 显示 了 动态 采样 方式 。 


[hf@testdb] SQL> exec dbms stats.delete table stats (hE 't temp2') ; 
PL/SQL procedure successfully completed. 
[hf@testdb] SQL> select count (*) from t temp2 where object id between 10000 and 50000; 


| Id | Operation | Name | Rows| Bytes|lCost (%CPU) | Time | 
| 0 | SELECT STATEMENT l | | 到 | 163 (0) | 00: 00: 02 | 
| 1 | SORT AGGREGATE | | 1]| zi3 | | | 


138K| 1761K| 163 (0) 


00: 00: 02 1 


Predicate Information (identified by operation id) : 


50000) 


Note 


- dynamic sampling used for this statement (level=2) 


从 上 面 的 例子 可 见 ， 临 时 表 默 认 是 采用 动态 采样 的 方式 ， 这 往往 是 一 种 比较 合适 的 方式 。 由 于 不 同 会 话 看 到 的 数据 不 同 ， 因 此 直接 收集 的 方式 往往 是 不 可 靠 的 。 但 临时 表 这 种 “ 粗 粒 度 ” 的 管理 方式 ， 
不 利于 生成 精确 的 执行 计划 。 因 此 语句 中 如 果 有 临时 表 ， 需 要 关注 因 统 计 信息 不 准确 导致 的 问题 。 


2. 索 引 统计 信息 


索引 是 数据 库 里 最 常见 的 对 象 。 下 面 通过 一 个 简单 的 例子 ， 看 看 索引 都 有 哪些 常见 的 统计 信息 。 


下 面 的 代码 创建 了 一 个 索引 ， 并 查看 其 统计 信息 。 因 为 显示 格式 问题 ， 这 里 使 用 了 一 个 过 程 print table， 后 面 将 在 附录 中 列 出 这 个 过 程 。 


[hf@testdb] SQL> create table tl as select * from dba objects; 

Table created. 

[hf@testdb] SQL> create index idx status on tl (status) ; 

Index created. R 

[hf@testdb] SQL> exec print table ('select index name, uniqueness, blevel, leaf blocks, distinct keys, num rows, avg_ leaf blocks per key, avg data blocks per key, clustering fact 


INDEX NAME : IDX STATUS 
UNIQUENESS : NONUNIQUE 
BLEVEL 2 过 

LEAF BLOCKS : 205 
DISTINCT KEYS 和 

NUM ROWS : 86274 

AVG_ LEAF BLOCKS PER KEY ;205 

AVG_ DATA BLOCKS PER KEY : ‘1232 
CLUSTERING FACTOR 232 
GLOBAL STATS : YES 
USER_STATS : NO 

SAMPLE SIZE : 86274 
ALYD ; 2014-11-10 


PL/SQL procedure successfully completed. 


下 面 看 一 下 索引 有 哪些 统计 信息 : 

' num_tows: 索引 行 。 

“ leaf _ blocks: 索引 叶 块 数 。 

“distinct_keys: 索引 不 同 键 数 。 

“blevel: 索引 的 blevel 分 支 层 数 (btree 的 深度 ， 从 root 节 点 到 leaf 节 点 的 深度 。 如 果 root 节 点 也 是 leaf 节 点 ， 那 么 这 个 深度 就 是 0) 。 

"avg leaf blocks_per key: 每 个 键 值 的 平均 索引 叶 块 数 〈 每 个 键 值 的 平均 索引 leaf 块 数 ， 近 似 取 整 ) ， 如 果 是 unique index 或 Pk， 这 个 值 总 是 1) 。 
“avg_data_blocks_per_key: 每 个 键 值 的 平均 索引 数据 〈 表 ) 块 数 。 


“ clustering_factor: 索引 的 聚 仿 因子 〈 一 个 度量 标准 ， 用 于 索引 的 有 序 度 和 表 混 乱 度 之 间 的 比较 ) 。 


我 们 在 上 面 的 索引 统计 信息 中 看 到 一 个 概念 一 一 聚 簇 因子 (clustering_factor) ， 这 是 一 个 比较 重要 的 概念 ， 用 于 标识 表 中 数据 的 存储 顺序 和 某 些 索引 字段 顺序 的 符合 程度 。Oracle 按 照 索 引 块 所 存储 


的 rowid 来 标识 相 邻 索引 记录 在 表 block 中 是 否 为 相同 块 。 如 果 索 引 中 存在 多 条 记录 a、b、c、d.… 若 b 和 a 是 同一 个 块 ， 则 比较 c 和 b; 若 不 在 同一 个 块 ， 则 clustering_factor+1， 然 后 比较 d 和 c; 若 还 不 是 

同一 个 块 ， 则 clustering factor+ 1.……。 这 样 计算 下 来 ，clustering_factor 会 是 介 于 表 块 数量 和 表 记 录 数 之 间 的 一 个 值 。 若 clustering_factor 接 近 块 数量 ， 则 说 明 表 中 数据 具有 比较 好 的 与 索引 字段 一 样 排序 
顺序 的 存储 ， 通 过 索引 进行 range scan 的 代价 比较 小 (需要 读 取 的 块 数 比 较 少 ) ; 若 clustering_factor 接 近 记 录 数 ， 则 说 明 数据 和 索引 字段 排序 顺序 差异 很 大 ， 杂 乱 无 章 ， 则 通过 索引 进行 range scan 的 代 
价 比较 大 (需要 读 取 的 表 块 可 能 很 多 ) 。 


下 面 通过 一 个 示例 ， 显 示 聚 簇 因子 的 一 些 使 用 问题 。 


[hf@testdb] SQL> create table tl as select rownum id, object name name from dba objects 
whererownum<=50000; 

Table created. 

[hf@testdb] SQL> create index idx tl on tl (id) ; 

Index created. 

[hf@testdb] SQL> exec dbms stats.gather table stats (user, 't1', cascade => true) ; 

PL/SQL procedure successfully completed. 

[hf@testdb] SQL> select blocks, num rows from user tables where table name = 'T1'; 
BLOCKS NUM ROWS 加 


252 50000 
[hf@testdb] SQL> select index name, blevel, leaf blocks, clustering factor 
fromuser indexes where table name = 'T1'; 
INDEX NAME BLEVEL LEAF BLOCKS CLUSTERING FACTOR 
IDX T1 1 110 240 


上 例 中 聚 篮 因 子 接近 表 的 块 数 ， 性 能 很 好 。 原 因 是 创建 表 时 指定 的 ID 列 是 一 个 递增 的 顺序 ， 因 此 索引 顺序 与 表 的 存放 顺序 高 度 一 致 。 


下 面 的 代码 使 用 了 一 个 反 转 索引 的 方法 。 所 谓 反 转 索引 ， 就 是 将 每 个 列 的 字 节 顺序 反 转 。 这 样 做 的 目的 是 将 顺序 值 打 乱 为 随机 散布 的 索引 项 。 由 这 个 例子 可 见 ， 其 聚 复 因 子 剧 增 ， 接 近 了 表 的 记录 数 ， 


[hf@testdb] SQL> alter index idx tl rebuild reverse; 

Index altered. 

[hf@testdb] SQL> select blocks, num rows from user tables where table name = 'T1'; 
BLOCKS NUM ROWS 


252 50000 
[hf@testdb] SQL> select index name, blevel, leaf blocks, clustering factor 
fromuser indexes where table name = 'T1'; 
INDEX NAME BLEVEL LEAF BLOCKS CLUSTERING FACTOR 
IDX T1 让 了 于 49994 
3. 字 段 统计 信息 


数据 库 除 了 表 、 索 引 外 ， 也 会 收集 字段 的 统计 信息 。 字 段 的 统计 信息 分 两 类 : 一 类 是 基本 信息 ， 另 外 一 类 是 柱状 
例子 进行 说 明 。 


网 


信息 。 我 们 后 面 会 有 专门 的 章节 介绍 柱状 


， 所 以 这 里 只 谈 基本 信息 。 下 面 通过 一 个 


[ 


[hf@testdb] SQL> create table tl as select * from dba objects; 
Table created. 
[hf@testdb] SQL> exec dbms stats.gather table stats toners. TL 
[hf@testdb] SQL> 1 
1 selectcolum name, 
2 decode (t.data type, 
3 'NUMBER', t.data typel|' ('||decode (t.data precision, null, t.data length||') ', t.data precision||', '||t.data scale||') ') ， 
4 'DATE', t.data type, 
5 'LONG', t.data type, 
6 'LONG RAW', t.data type, 
7 'ROWID', t.data type, 
8 'MLSLABEL', t.data type, 
9 t.data typel|' ('||lt.data length||') ') 112 "|] 
10 decode (t.nullable, > 
镁 'N', 'NOT NULL', 
12 "mn'，'NOT NULL', 
1 NULL) col, 
14 num distinct, num nulls, density, avg col len, histogram, num buckets 
15 fromuser tab cols 七 2 
16* where table name="'T1' 
[hf@testdb] SOL> / 


COLUMN_ NAME CoOL NUM DISTINCT NUM NULLS DENSITY AVG COL LEN HISTO NUM BUCKETS 
OWNER VARCHAR2 (30) 24 0 .041666667 6 NONE 下 
OBJECT NAME VARCHAR2 (128) 51744 0 .000019326 25 NONE 业 
SUBOBJECT NAME VARCHAR2 (30) 89 86009 .011235955 2 NONE 1 
OBJECT ID NUMBER (22) 86274 0 .000011591 5 NONE 1 
DATA OBJECT ID NUMBER (22) 8583 77651 .000116509 2 NONE 和 
OBJECT TYPE VARCHAR2 (19) 44 0 .022727273 9 NONE 出 
CREATED DATE 889 0 .001124859 8 NONE bb 
LAST DDL TIME DATE 1004 0 .000996016 8 NONE 1 
TIMESTAMP VARCHAR2 (19) 1044 0 .000957854 20 NONE . 
STATUS VARCHAR2 (7) 1 0 1 6 NONE 4 
TEMPORARY VARCHAR2 (1) 有 0 “5 2 NONE 本 
GENERATED VARCHAR2 (1) 2 0 a 2 NONE 思 
SECONDARY VARCHAR2 (1) 0 :5 2 NONE J 
NAMESPACE NUMBER (22) 20 0 .05 3 NONE 和 
EDITION NAME VARCHAR2 (30) 0 86274 0 0 NONE 0 


默认 的 情况 下 ， 数 据 库 会 为 列 收 集 基本 信息 ， 但 不 会 收集 柱状 图 信息 。 在 使 用 dbms _stats.gather_ table_stats 收 集 表 的 统计 信息 时 ， 未 指定 method_opt， 则 Oracle 将 采用 FOR ALL COLUMNS SIZE 
AUTO 选 型 。 从 10g 开 始 ， 有 一 个 内 置 的 参数 column _tracking_level， 可 以 通过 它 来 控制 是 否 监控 列 的 使 用 。 默 认 这 个 参数 是 打开 的 ， 此 时 如 果 某 些 倾 狸 列 被 频繁 使 用 ， 则 Oracle 会 在 Auto 模 式 下 ， 自 动 
为 该 列 收集 柱状 图 。 


下 面 看 看 列 统计 信息 的 主要 项 : 


' num_distinct: 不 同 值 的 数目 。 

“ num_nulls: 字段 值 为 nall 的 数目 。 

“ density: 选择 率 。 

“ low_value: 最 小 值 ， 显 示 为 内 部 存储 的 格式 。 注 意 ， 字 符 串 列 只 存储 前 32 字 节 。 
“ high_value: 最 大 值 ， 显 示 为 内 部 存储 的 格式 。 注 意 ， 字 符 串 列 只 存储 前 32 字 节 。 
“ avg_col_len: 列 平均 长 度 ( 字 节 ) 。 


“ histogram: 是 否 有 直方 图 统计 信息 。 如 果 有 ， 则 是 哪 种 类 型 。10g 以 后 的 版 本 才 提 供 。 


“NONE: 没有 直方 


| 


. FREQUENCY: 频率 类 型 。 
. HEIGHT BALANCED: 平均 分 布 类 型 。 


' num_buckets: 直方 图 的 桶 数 。 


这 里 引入 了 一 个 很 重要 的 概念 一 一 选择 率 。 这 个 指标 反映 了 字段 的 选择 性 。 优 化 器 通过 选择 率 与 记录 数 的 乘积 来 获得 基数 。 这 是 作为 执行 路 径 选 择 的 一 个 重要 依据 。 选 择 率 的 计算 方法 与 字段 是 否 存在 
柱状 图 有 关 ， 这 里 只 介绍 在 字典 不 存在 柱状 图 的 情况 下 的 计算 方法 ， 也 就 是 没有 柱状 图 的 情况 ; 有 柱状 图 的 情况 后 面 的 章节 将 单独 介绍 。 对 于 没有 柱状 图 的 情况 ， 字 段 选择 率 为 num_distinct。 下 面 通过 
示例 说 明 。 


| 
起 


hf@testdb] SQL> create table tl1 as select rownumid , object name, status from dba objects where rownum<=50000; 
Table created. 

hf@testdb] SQL> exec dbms stats.gather table stats (user, 'T1') ; 

PL/SQL procedure successfully completed. 加 

hf@testdb] SQL> select min (id) , max (id) from tl1; 

MIN (ID) MAX (ID) 


这 里 创建 了 一 个 测试 表 ， 表 的 ID 字段 范围 是 1~50000。 


[hf@testdb] SQL> select column name, num distinct, num nulls, density, histogram, num buckets 
fromuser tab cols t 
3 wheretable name="'T1'; 


COLUMN_NAME NUM DISTINCT NUM NULLS DENSITY HISTO NUM BUCKETS 
ID 50000 0 .00002 NONE 
OBJECT NAME 28810 0 .00003471 NONE 1 
STATUS 1 0 1 NONE 1 


从 统计 信息 可 见 ，1D 字 段 的 选择 率 为 num_distinct=1/50000。 


[hf@testdb] SQL> select * from tl where id between 1 and 10000; 
10000 rows selected. 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT | | 10000 | 351K| 82 (Oy | D0 G0 61. 1 
I* 1 | TABLE ACCESS FULL| T1 | 10000 | 351K| 82 (0) | 00: 00: 01 | 


对 ID 字 段 执 行 了 一 个 范围 查询 ， 这 里 评估 出 的 基数 为 10000。 这 是 在 全 表 5 万 条 记录 中 选择 出 的 1 万 条 ， 选 择 率 为 1/50000 计 算得 来 的 。 具 体 计 算 方 法 是 : 选择 率 x 选 择 范围 x 记 录 数 = 评估 基数 ， 即 
1/50000*10000*50000 = 10000。 


4. 直 方 图 信息 


当 数 据 字 段 的 数据 分 布 不 均匀 时 ， 通 过 之 前 的 字段 统计 信息 优化 器 往往 很 难 做 出 正确 的 估算 。 为 了 解决 这 一 问题 ，Oracle 引 入 了 一 种 新 的 统计 信息 类 型 一 一 直方 图 。 简 单 来 说 ， 它 就 是 来 反映 数据 分 布 
情况 的 一 种 统计 信息 。 从 原理 上 来 讲 ， 就 是 假定 存在 n 个 桶 (buckets) ， 每 个 桶 代表 一 个 取 值 或 者 一 个 取 值 范围 ， 将 列 中 不 同 的 值 放 入 与 之 对 应 的 桶 中 ， 通 过 这 些 桶 的 统计 来 得 到 列 上 数据 分 布 的 情况 。 


根据 唯一 值 的 数量 和 桶 的 个 数 ， 可 以 将 直方 图 分 为 两 种 类 型 (在 12c 中 ， 又 细 分 为 4 种 ) : 基于 频率 的 直方 图 和 基于 高 度 的 直方 图 。 下 面 针 对 这 两 种 直方 图 分 别 加 以 说 明 。 


网 


(1) 基于 频率 的 直方 | 


当 列 的 唯一 值 数量 小 于 或 等 于 桶 允许 的 最 大 值 (254) 时 ， 数 据 库 会 使 用 基于 频率 的 直方 图 。 每 个 值 将 会 占据 一 个 桶 。 每 个 桶 的 高 低 代表 每 个 值 出 现 的 次 数 。 下 面 通过 一 个 图 简单 说 明 ， 如 图 4-1 所 示 。 


频 度 


图 4-1 基于 频率 的 直方 图 


下 面 通过 一 个 实际 的 例子 ， 帮 大 家 体会 一 下 基于 频率 的 直方 


[ 


[hf@testdb] SQL> execute dbms random.seed (0) ; 
PL/SQL procedure successfully completed. 
[hf@testdb] SQL> create table tl 

2 as 

3 selecttrunc (dbms random.value (1, 10) ) val 
4 from dual 

5 connect by rownum<= 10000; 

Table created. 


这 里 创建 了 一 个 测试 表 ， 共 插入 了 10000 条 记录 ， 其 中 的 VAL 字 段 为 1~9 之 间 的 随机 整数 。 


[hf@testdb] SQL> exec dbms stats.gather table stats (user, 't1', 


PL/SQL procedure successfully completed. 


[hf@testdb] SQL> select num distinct, num buckets, histogram 


2 fromuser tab columns 
3 wheretable name='T1' and column name='VAL'; 
NUM DISTINCT NUM BUCKETS HISTOGRAM 


9 9 FREQUENCY 


method opt => 'for columns valsize 254') ; 


这 里 收集 了 统计 信息 ， 注 意 收集 统计 的 选 型 使 


面 的 查询 也 可 以 看 出 ， 这 个 表 有 9 个 不 同 的 值 ， 使 


了 “for columns val size 254”。 这 表示 采 


了 9 个 桶 ， 整 个 直 


网 


方 图 的 类 型 为 基于 频率 的 直方 图 。 


[hf@testdb] SQL> select endpoint number, 
2 fromuser tab histograms 出 
3 wherecolumn name = 'VAL' and table name = 
4 order by endpoint number; EE 


ENDPOINT NUMBER ENDPOINT VALUE 


endpoint value 


rmT1， 


9 rows selected. 


254 个 桶 来 收集 VAL 字 段 的 统计 信息 。 


加 


为 这 个 字段 的 不 同 值 只 有 9 个 ， 因 此 会 使 有 


基于 频率 的 直方 


可 以 从 user tab_histograms 视 图 中 查看 直方 医 


的 具体 信息 。 这 里 有 两 个 主 


字段 ， 其 含义 分 别 如 下 : 


@ 


ENDPOINT_VALUE: 该 值 本 身 。 如 果 字 段 是 NUMBER 类 型 ， 


"ENDPOINT_NUMBER: 取 值 的 累计 出 现 次 数 。 当 前 endpoint_number 减 去 上 一 个 endi 


可 以 直接 显示 ; 对 于 非 数字 类 型 (VARCHAR2、CHAR、NVARCHAR2、NCHAR 和 RAW) 必须 要 进行 转换 。 


oint_number 就 是 当前 行 出 现 的 次 数 。 


[hf@testdb] SQL> select val, count (*) 
COUNT (*) 


from tl1 group by val order by val; 


十 
网 


对 照 这 个 查询 与 上 面 直 


(2) 基于 高 度 的 直方 图 


当 列 的 唯一 值 数量 大 于 桶 数 时 ， 数 据 库 会 基于 高 度 的 直方 图 


的 输出 ， 就 很 容易 理解 了 。VAL = 1 的 记录 ， 共 有 1160 个 ; VAL= 2 的 记录 ， 共 有 1173 (有 


映 数据 分 布 ， 每 个 桶 容纳 相同 数量 的 值 。 下 面 通过 一 个 


2333-1160) ; 以 此 类 推 。 


图 简单 说 明 ， 如 


py 
4 而 


4-2 所 示 。 


I 


dr LL, 


a 


值 2 
但 1] 


通过 一 个 实际 的 例子 ， 帮 大 家 体会 一 下 基于 高 度 的 直方 图 。 


图 4-2 ”基于 高 度 的 直方 图 


出 


下 


对 


[hf@testdb] SQL> execute dbms random.seed (0) ; 
PL/SQL procedure successfully completed. 
[hf@testdb] SQL> create table tl 

2 as 

3 selecttrunc (doms random.value (1, 100) ) val 
4 from dual 

5 connect by rownum<= 10000; 

Table created. 


里 创建 了 一 个 测试 表 ， 共 插入 了 10000 条 记录 。 其 中 的 VAL 字 段 为 1~99 之 间 的 随机 整数 。 


放 


[hf@testdb] SQL> exec dbms stats.gather table stats (user, 't1', 
PL/SQL procedure successfully completed. 

[hf@testdb] SQL> select num distinct, num buckets, histogram 

2 fromuser tab columns S 

3 wheretable name='T1' and column name='VAL'; 

NUM DISTINCT NUM BUCKETS HISTOGRAM 


99 50 HEIGHT BALANCED 


method opt => 'for columns val size 50'); 


= 用 3 


50 个 桶 来 收集 VAL 字 段 的 统计 信息 。 


了 “for columns val size 50”。 这 表示 采 


这 里 收集 了 统计 信息 ， 注 意 收集 统计 的 选 型 使 


的 类 型 为 基于 高 度 的 直方 


了 50 个 桶 ， 整 个 直方 医 


的 查询 也 可 以 看 出 ， 这 个 表 有 99 个 不 同 的 值 ， 使 


0 
回 


加 


过 
网 


高 度 的 


为 这 个 字段 的 不 同 值 只 有 99 个 ， 因 此 会 使 用 基 


[hf@testdb] SQL> select endpoint number, endpoint value 
2 fromuser tab histograms 

3 wherecolumn name = 'VAL' and table name = 'T1' 

4 order by endpoint number; 

ENDPOINT NUMBER ENDPOINT VALUE 


oamwmmwnF 品 
户 户 户 户 记忆 
oODoawN 


10 
http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/... 
99 
51 rows selected. 


可 以 从 user_tab_histograms 视 图 中 ， 查 看 直方 图 的 具体 信息 。 这 里 有 两 个 主要 字段 ， 其 含义 分 别 如 下 : 
"ENDPOINT_VALUE: 列 的 数值 。 该 列 是 NUMBER 类 型 ， 如 果 直 方 图 列 是 非 数 字 类 型 则 需要 转换 ， 且 只 取 字 段 的 前 六 个 字 节 (不 是 字符 并 记录 到 数据 字典 中 ) 。 


“ENDPOINT_NUMBER: 桶 号 。 


如 何 解读 上 面 的 输出 呢 ; 上 面 输出 代表 VAL= 1， 占 据 了 0 号 桶 ; VAL= 2， 占 据 了 1 号 桶 ; VAL= 3、4， 占 据 了 2 号 桶 ; VAL = 5、6 占 据 了 3 号 桶 ; 以 此 类 推 。 


(3) 直方 图 对 执行 计划 的 影响 


如 果 字 段 存 在 倾斜 ， 且 也 分 析 了 直方 图 ， 则 在 生成 执行 计划 时 与 没有 直方 图 不 同 。 如 果 有 直方 图 ， 会 影响 计算 成 本 中 的 选择 因子 density。 在 user_tab_columns 里 有 这 样 的 两 个 列 num_distinct 和 | 
density。 在 计算 基数 时 ， 如 果 没 有 直方 图 则 基数 为 num_rows/num_distinct; 如 果 有 直方 图 则 为 num_rows*density (此 时 的 density<>1/num _distinct) 。 


[ 


[ 


出 


下 面 通过 一 个 案例 ， 说 明 在 有 没有 直方 图 的 情况 下 执行 计划 的 不 同 。 


构建 的 表 中 ， 数 据 严重 不 均衡 ,OWNER='HF' 的 有 1 条 ，OWNER='PUBLIC' 的 有 3 万 多 条 。 


[hf@testdb] SQL> create table tl as select * from dba objects; 
Table created. 

[hf@testdb] SQL> create index idx owner on tl (owner) ; 

Index created. 

[hf@testdb] SQL> select owner, count (*) from tl1 group by owner; 


OWNER COUNT (*) 
OWBSYS_AUDIT 12 
MDSYS 2011 
HF 本 
PUBLIC 33996 


http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/O0EBPS/Text/... 
24 rows selected. 


收集 了 一 个 直方 图 ， 这 是 一 个 基于 频率 的 直方 图 。 


[hf@testdb] SQL> exec dbms stats.gather table stats (user, 't1l', cascade =>true, method opt => 'for columns owner size 254') ; 
PL/SQL procedure successfully completed. 加 加 

[hf@testdb] SQL> select num distinct, num buckets, histogram 

2 fromuser tab columns 

3 wheretable name='T1' and column name="'OWNER'; 

NUM DISTINCT NUM BUCKETS HISTOGRAM 


24 20 FREQUENCY 


对 于 返回 较 少 数据 的 情况 ， 例 如 下 面 的 OWNER='HF' 的 情况 ， 优 化 器 选择 使 用 了 索引 扫描 。 


[hf@testdb] SQL> select * from tl where owne 


| 0 | SELECT STATEMENT | | 
| 1 | TABLE ACCESS BY INDEX ROWID 

| 得 | 
喀 ; 这 中 INDEX RANGE SCAN | IDX OWNER | 


对 于 返回 较 多 数据 的 情况 ， 例 如 下 面 的 OWNER='PUBLIC' 的 情况 ， 优 化 器 选择 使 用 了 全 表 扫 描 。 这 显然 是 个 不 错 的 选择 。 根 据 数 据 分 布 不 同 ， 选 择 了 更 为 高 效 的 处 理 方式 。 


[hf@testdb] SQL> select * from tl where owner='PUBLIC'; 
33996 rows selected. 


| Id | Operation | Name | Rows | Bytes | Cost %CPU) | Time 
| 0 | SELECT STATEMENT | 1 33513 | 3207K| 344 (1) | 00: 00: 05 | 
I* 1 | TABLE ACCESS FULL| Tl1 | 33513 | 3207K| 344 (1y | 007 00: 05 | 


后 面 我 们 去 掉 了 直方 图 ， 即 忽视 了 数据 的 不 均衡 问题 。 


[hf@testdb] SQL> exec dbms stats.gather table stats (user, 't1l', cascade =>true, method opt => 'for columns owner size 1'); 
PL/SQL procedure successfully completed. 

[hf@testdb] SQL> select num distinct, num buckets, histogram 

2 fromuser tab columns 加 加 

3 wheretable name='T1' and column name="'OWNER'; 

NUM DISTINCT NUM BUCKETS HISTOGRAM 


之 后 ， 查 询 均 使 用 了 索引 扫描 的 方式 ， 即 使 是 返回 大 量 数据 的 owner='PUBLIC' 的 查询 。 可 见 ， 这 并 不 是 一 个 很 好 的 选择 。 


在 去 掉 了 直方 


哆 


[hf@testdb] SQL> alter system flush shared pool; 
System altered. 
[hf@testdb] SQL> select * from tl where owner='HF'; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT | 1 3595 1 344K| 105 (0) | 00: 00: 02 | 
| 1 | TABLE ACCESS BY INDEX ROWID 

| T1 | 3595 1 344K| 105 (0) | 00: 00: 02 | 


| INDEX RANGE SCAN | IDX OWNER | 3595 | | E] 《oh il O00 002 OL | 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT | | 3595 | 344K| 105 (0) | 00: 00: 02 | 
| 1 | TABLE ACCESS BY INDEX ROWID 

| 3595 | 344K| 105 (0) | 00: 00: 02 | 
[| INDEX RANGE SCAN | IDX OWNER | 3595 | | EE (0) | 00: 00: 01 | 


5. 扩 展 统计 信息 


除了 针对 表 、 索 引 、 字 段 外 ， 从 119 开 始 也 提供 了 针对 多 列 的 统计 信息 。 所 谓 多 列 的 统计 信息 是 指 对 多 个 存在 关联 关系 的 列 (作为 一 个 组 合 列 ) 收集 的 统计 信息 。 如 果 查 询 语句 的 WHERE 条 件 中 出 现 这 
个 组 合 列 所 涉及 的 关联 列 的 过 滤 条 件 ， 则 优化 器 在 判断 时 会 使 用 多 列 统计 信息 进行 估算 ， 而 不 再 使 用 原始 多 列 组 合 进行 估算 。 


下 面 通 过 一 个 案例 说 明 统计 信息 的 具体 用 法 。 


下 面 的 代码 构造 了 一 表 t1， 并 插入 了 1 万 条 记录 。 要 注意 的 是 ， 表 中 字段 n1 和 n2 的 值 完 全 一 样 ， 也 就 是 说 这 两 个 字段 是 “有 关联 ”的 。 


[hf@testdb] SQL> create table tl ( nl number, n2 number) ; 

Table created. 

[hf@testdb] SQL> insert into tl select 1, trunc (dbms_ random.value (0, 100) ) from dba_objects where rownum<10001; 

10000 rows created. 

[hf@testdb] SQL> update tl1 set nl=n2; 

10000 rows updated. 

[hf@testdb] SQL> commit; 

Commit complete. 

[hf@testdb] SQL> exec dbms stats.gather table stats (ownname=>'HF', tabname=>'T1', cascade=>true, estimate percent=>100) ; 
PL/SQL procedure successfully completed. 加 


执行 了 一 个 查询 语句 ， 从 Rows 可 见 ， 其 评估 出 的 记录 数 为 1。 这 是 因为 优化 器 按照 两 个 字段 的 选择 率 相 乘 作为 整体 的 选择 率 。 因 为 n1 和 n2 字 段 都 是 随机 插入 的 1~100 之 间 的 数据 ， 因 此 单字 段 的 选择 率 
为 1/100， 组 合 在 一 起 就 是 1/10000。 表 共有 10000 条 记录 ， 因 此 估算 选择 出 的 记录 数 为 1 条 。 


[hf@testdb] SQL> select * from tl where nl=1 and n2=1; 


| Id | Operation | Name | Rows 
| 0 | SELECT STATEMENT | | 
I* 1 | TABLE ACCESS FULL| T1 | 


1 - filter ("N1"=1 AND "N2"=1) 


由 下 页 的 代码 可 知 ， 实 际 返回 的 记录 数 为 94， 这 与 估计 的 值 差异 很 大 。 原 因 就 是 优化 器 无 法 得 知 nh1、n2 两 个 列 的 值 是 有 关联 的 。 


[hf@testdb] SQL> select count (*) from t1 where nl=1 and n2=1; 
COUNT (*) 


下 面 的 代码 创建 了 一 个 扩展 统计 信息 ， 从 视图 中 可 见 ， 这 个 扩展 是 包含 了 (n1，n2) 列 。 


[hf@testdb] SQL> declare 
受 cg_namevarchar2 (30) ; 

3 begin 
4 cg_name: =sys.dbms stats.create extended stats ('HF', 'T1', ' (nl，n2) ') ; 
5 dbms output.put line (cg name) ; 

6 end; 加 本 

了 

SYS_STUBZHOIHA7K$KEBJVXOS5LOHAS 

PL/SQL procedure successfully completed. 

[hf@testdb] SQL> select extension name, extension from dba stat extensions where table name='T1' and owner='HF'; 

EXTENSION NAME. EXTENSION 0 下 


SYS_STUBZHOIHA7K$KEBJVXOSLOHAS ("N1", "N2") 


从 下 面 的 代码 中 的 Rows 输 出 可 见 ， 估 算 的 行 数 是 100， 这 显然 是 充分 考虑 到 n1=n2 的 情况 ， 且 与 实际 的 94 条 记录 差异 不 大 。 


[hf@testdb] SQL> exec dbms stats.gather table stats (ownname=>'HF', tabname=>'T1', method opt=>'for columns (nl, n2) size auto', estimate percent=>100) ; 
PL/SQL procedure successfully completed. 
[hf@testdb] SQL> select * from tl where nl=] and n2=1; 


| Id | Operation | Name | Rows | Bytes | Cost | 

| 0 | SELECT STATEMENT | 1 100 | 600 | 3 (wy 00s O00 OF | 
I* 1 | TABLE ACCESS FULL| T1 | 100 | 600 | 2 (0) | 00: 00: 01 | 
6 动态 采样 


随 着 Oracle 数 据 库 逐步 淘汰 了 RBO 的 优化 器 方式 ，CBO 成 为 优化 器 的 唯一 选择 。 而 CBO 需 要 依赖 于 准确 的 统计 信息 ， 如 果 对 象 没有 收集 统计 信息 ， 则 会 造成 很 大 的 问题 。 此 时 ， 就 需要 一 种 机 制 避免 
为 统计 信息 缺失 可 能 导致 的 产生 低 效 执行 计划 的 问题 。 动 态 采 样 正 是 为 了 帮助 优化 器 获得 尽 可 能 多 的 信息 ， 可 以 把 它 视 为 对 象 统计 信息 的 必要 补充 。 


一 般 而 言 ， 在 下 列 情况 下 可 能 会 使 用 动态 采样 : 


“ 当 表 、 索 引 等 对 象 缺乏 统计 信息 的 时 候 ， 优 化 器 可 采用 动态 采样 。 


“ 临时 表 。 一 般 来 说 ， 临 时 表 没 有 统计 信息 ， 多 采用 动态 采样 的 手段 收集 。 


“ 对 于 复杂 逻辑 ， 优 化 器 可 能 无 法 准确 评估 ， 可 以 采用 动态 采样 。 


针对 动态 采样 ， 可 以 采用 不 同 的 层次 。 层 次 越 高 ， 其 收集 的 信息 越 准确 ， 当 然 其 开销 也 越 大 。 在 不 同 的 数据 库 版 本 中 ， 其 对 应 的 动态 采样 的 默认 层次 也 不 一 样 。 如 果 采 样 的 层次 设置 为 ?3， 则 查询 优化 器 
通过 测量 样本 中 记录 的 选择 性 来 估算 语句 中 条 件 的 选择 性 ， 而 不 是 使 用 数据 字典 中 的 统计 信息 或 者 手工 设置 的 值 。 如 果 采 样 的 层次 设置 为 4 或 者 更 高 ， 则 除了 层级 为 了 的 操作 外 ， 还 会 将 当 同 一 张 表 的 两 个 或 
者 更 多 的 字段 在 WHERE 子 句 中 被 引用 也 进行 动态 采样 。 当 字段 间 有 关系 的 时 候 ， 这 将 非常 有 助 于 提高 估算 的 性 能 。 表 4-1 所 示 是 动态 采样 的 层次 及 含义 说 明 。 


表 4-1 动态 采样 的 层次 及 含义 说 明 


层级 何 时 使 用 动态 采样 数据 块 的 数量 
0 关闭 动态 采样 0 

We 有 对 象 统计 信息 的 表 使 用 动态 采样 人 1 有 在 符合 如 下 三 种 ; pe 才 会 发 sg 

: 表 没有 过 是 连接 的 一 部 分 (包括 子 查询 和 不 可 合并 视图 )、 块 数 多 于 采样 数 

2 对 所 有 没有 对 象 统计 的 表 使 用 动态 采样 64 

3 对 所 有 符合 层级 2 标准 的 表 以 及 使 用 了 评估 条 件 选择 性 猪 测 的 表 使 用 动态 采样 32 

有 对 所 有 符合 层级 3 标准 的 表 以 及 WHERE 子 句 中 引用 了 两 个 或 更 多 字段 的 表 使 用 动 炳 

态 采 样 

5 等 同 于 层级 4 64 

6 等 同 于 层级 4 128 

7 等 同 于 层级 4 256 

8 等 同 于 层级 4 1024 

9 等 同 于 层级 4 4096 
10 等 同 于 层级 4 i 全 部 数据 块 


下 面 通过 一 个 例子 说 明 动 态 采 样 的 使 用 。 


hf@testdb] SQL> create table tl ( a int, bvarchar (100) ) ; 
Table created. 

hf@testdb] SQL> insert into tl select object id, 
86282 rows created. 

hf@testdb] o> commit; 

Commit complet: 

和 上面 创建 了 一 个 未 向 表 ， 然后 插入 了 8 万 多 条 记录 。 
Index created. 

hf@testdb] SQL> select * from tl where a=100; 


object name from dba objects; 


[hf@testdb] SQL> create index idx tl a on tl (a) ; 


Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
0 | SELECT STATEMENT | Ea | 65 | 2 (0) | 00: 00: 01 | 
1 | TABLE ACCESS BY INDEX ROWID 
| 21 lL | 5 .| 2 0X 1 00: QO OE 
可 INDEX RANGE SCAN | IDX TI A | | | 1 (0) | 00: 00: 01 | 


Note 


- dynamic sampling used for this statement (level=2) 


从 Note 可 以 看 出 ， 这 里 使 用 了 动态 采样 ， 层 次 是 2。 
4.1.3 ”数据 字典 统计 信息 

数据 字典 统计 信息 是 用 来 描述 数据 字典 基 表 、 索 引 等 的 详细 信息 。 这 同 普通 表 、 索 引 等 没有 什么 区 别 。 唯 一 的 区 别 就 是 管理 的 方法 不 同 ， 需 要 专门 的 语句 进行 操作 ， 关 于 统计 信息 操作 后 面 会 详细 说 
明 。 


另外 有 一 点 需要 注意 ， 那 就 是 从 10g 开 始 ， 数 据 字典 统计 信息 可 以 自动 收集 。 


4.1.4 内 部 对 象 统计 信息 


内 部 对 象 统计 信息 是 用 来 描述 内 部 表 ( 例 几 


0X$ 系 统 表 ) 的 详细 信息 。 从 本 质 来 说 ，X$ 表 是 基于 内 存 数 据 结构 的 。 如 果 它 的 统计 信息 不 准确 ， 会 造成 低 效 的 执行 计划 。 


为 X$ 本 身 就 是 内 存 结构 ， 低 效 的 


内 的 话 ， 数 据 库 会 出 现 CPU 使 


超 高 甚至 全 库 挂 起 的 情况 。 


执行 计划 可 能 会 造成 访问 内 存 结构 所 持 有 的 Latch 或 Mutex 长 时 间 得 不 到 释放 。 如 果 出 现 大 规模 争 


与 普通 对 象 对 比 ， 内 部 对 象 的 统计 信息 管理 方法 不 同 。 此 外 ， 如 果 内 部 对 象 缺 少 统计 信息 ， 数 据 库 是 不 会 采用 动态 采样 机 所 


4.2 ”统计 信息 操作 


常见 的 统计 信息 操作 包括 查看 、 收 集 、 修 改 、 删 除 、 锁 定 等 。 下 面 针对 每 种 操作 ， 简 单 说 明 一 下 。 


统计 信息 相关 的 操作 中 ， 最 常见 的 就 是 查看 操作 。 常 见 的 场景 是 需要 判断 统计 信息 是 否 准确 ， 进 而 排除 可 能 


们 可 以 通过 视图 去 查询 相关 统计 信息 。 
收集 统计 信息 也 非常 重要 。 在 一 般 情 况 下 ， 系 统 自动 收集 的 统计 信息 是 可 以 满足 我 们 需要 的 ， 但 也 有 些 情况 是 需要 人 为 干预、 手工 收集 统计 信息 。 


针对 常见 的 一 些 情 况 加 以 说 明 。 


因为 统计 信息 失真 导致 优化 器 制定 出 低 效 执行 计划 的 情况 。 


的 。 一 般 只 有 在 确定 是 内 部 对 象 统计 信息 不 准 的 情况 下 ， 才 额外 收集 它 。 


统计 信息 保存 在 数据 字典 中 ， 我 


这 部 分 比较 复杂 ， 相 关 命 令 的 选项 也 比较 多 ， 下 面 会 


修改 统计 信息 操作 很 少见 。 常 见 的 情况 是 对 象 非常 大 ， 做 收集 动作 非常 慢 ， 才 采取 人 为 修改 统计 信息 的 方式 ;或 者 是 在 测试 环境 中 ， 为 了 模拟 某 些 操作 行为 ， 而 又 没有 那么 大 数据 量 而 采取 手工 修改 来 


欺骗 优化 器 。 不 建议 进行 修改 操作 ， 除 非 是 对 各 种 统计 信息 指标 非常 了 解 。 


删除 统计 信息 的 操作 ， 相 对 用 得 较 少 。 


手工 删除 直方 图 统计 信息 。 


常见 的 情况 是 现 有 统计 信息 有 问题 ， 只 需要 重新 收集 然后 覆盖 就 可 以 了 ， 基 本 不 需要 有 删除。 一般 只 有 在 直方 图 中 


锁定 统计 信息 也 不 太 常用 。 它 主要 是 为 了 避免 


下 面 针 对 不 同类 别 的 统计 信息 的 主要 操作 分 别 加 以 说 明 。 


4.2.1 系统 统计 信息 


1. 收 集 统计 信息 


错误 地 收集 了 直方 图 信息 导致 问题 ， 才 需 


因 统 计 信息 变化 导致 执行 计划 发 生变 化 。 一 般 我 们 是 相信 系统 对 统计 信息 的 处 理 的 ， 不 需要 锁定 处 理 。 


我 们 知道 ， 系 统统 计 信 息 分 为 两 种 ， 一 种 是 非 工作 量 统计 信息 (noworkload statistics) 和 工作 量 统计 信息 (workload statistics) 。 从 10g 开 始 ， 非 工作 量 的 统计 信息 总 是 可 用 的 。 对 于 工作 量 统计 信 


息 ， 则 可 以 按照 下 面 步骤 进行 收集 : 


exec dbms stats.gather System stats ('start') // 开 始 收 集 系 统统 计 信息 运行 一 段 时 间 


exec dbms stats.gather system stats ('stop') // 停 止 收 集 系统 统计 信息 


// 最 好 是 以 系统 典型 负载 运行 一 段 时 间 


除了 上 面 的 方法 外 ， 也 可 以 用 下 面 的 方法 ， 其 中 interval 参 数 为 间隔 时 长 (单位 分 钟 ) : 


dbms_stats.gather system stats (gathering mode=>'interval'， interval=>N) ; 


2. 查 看 统计 信息 


系统 统计 信息 放 在 aux_stats$ 表 里 面 。Oracle 没 有 提供 数据 字典 视图 来 供 外 部 访问 。 根 据 sname 不 同 ， 可 以 将 统计 信息 划分 为 三 个 : 


“ SYSSTATS_INFO: 系统 统计 信息 的 状态 和 收集 时 间 。 


“SYSSTATS_MAIN: 系统 统计 信息 结果 集 。 


“SYSSTATS_TEMP: 用 来 计算 系统 统计 信息 ， 只 有 收集 工作 量 统计 信息 时 才 可 用 。 


查看 系统 统计 信息 的 方法 如 下 : 


结果 集 (不 同类 别 的 信息 ) ， 分 别 如 下 : 


select pname, pvall from sys.aux stats$ where sname='SYSSTATS MAIN'; 


也 可 以 使 用 dbms_stats.get_system_stats 过 程 获得 统计 信息 。 


3. 修 改 统 计 信息 


手工 设置 统计 信息 ， 大 致 操作 如 下 : 


begin 


dbms_stats. 
dbms_stats. 
dbms_stats. 
dbms_stats. 
dbms_stats. 
dbms_stats. 


end; 


set_system stats 
set_system stats 
set_system stats 
set_system stats 
set system stats 
set_system stats 


(pname=>'CPUSPEED', pvalue=>772) ; 
(pname=>'SREADTIM', pvalue=>5.5) ; 
(pname=>'MREADTIM', pvalue=>19.4) ; 
(pname=>'MBRC', pvalue=>53) ; 


(pname=>'MAXTHR', pvalue=>1243434334) ; 
(pname=>'SLAVETHR', pvalue=>1212121) ; 


*pname 为 指定 统计 信息 参数 ，pvalue 为 统计 信息 的 值 


4. 删 除 统计 信息 


删除 统计 信息 的 方法 如 下 : 


execdbms_stats.delete_ system stats; // 调 用 这 个 过 程 不 需要 参数 


4.2.2 ”对 象 统计 信息 


对 象 统计 信息 的 相关 操作 是 日 常 使 用 最 多 的 。 


1. 收 集 统计 信息 


收集 统计 信息 3 


dbms stats 包 本 身 很 复杂 ， 涉 及 统计 信息 方方面面 的 操作 都 可 以 通过 它 完 成 。 下 


收集 整个 库 中 对 象 的 统计 信息 ， 采 


EF 要 由 analyze 命 令 和 dbms_stats 包 实现 。 一 般 建议 使 
点 ， 下 面 主要 介绍 一 下 dbms_stats 包 的 


法 。 


率 通过 estimate_percent 指 定 ， 这 里 为 15%， 命 令 如 下 : 


dbms stats 代 蔡 analyze 命 令 。 当 然 这 两 者 不 是 完全 等 价 的 ， 有 些 情况 必须 要 使 用 analyze， 例 如 分 析 索 引 的 结构 信息 。 作 为 重 


主要 针对 对 象 统计 信息 的 收集 动作 ， 通 过 几 个 例子 说 明 一 下 它 的 用 法 及 主要 参数 。 


exec dbms_stats.gather database stats (estimate percent => 15) ; 


收集 指定 Schema 的 统计 信息 ， 命 令 如 下 : 


exec dbms_ stats.gather schema stats ('scott', estimate percent => 15); 


收集 指定 表 的 统计 信息 ， 命 令 如 下 : 


exec dbms_stats.gather table stats ('scott', 'employees'， estimate percent => 15) ; 


通过 method_opt 指 定 是 否 收集 直方 


图 


， 例 子 中 说 明 为 所 有 有 索引 的 列 收集 且 只 会 为 现 有 的 直方 苞 


表 收 集 对 象 、 分 区 、 子 分 区 统计 信息 。 通 过 cascade 选 项 指定 是 否 收集 索引 的 统计 信息 。 


重新 分 析 ， 不 再 搜索 其 他 直方 


。 通 过 granularity 指 定 如 何 处 理 分 区 对 象 的 统计 信息 ， 这 里 指定 all 代 


execdbms_stats.gather _ table stats (ownname => 'prd user', tabname => 'prd syi search', method opt => 'for all indexed columns size repeat', granularity=>'all', cascade => true) 
execdbms_stats.gather index stats ('scott', ‘employees pk', estimate percent => 15) ; 


2. 查 看 统计 信息 


根据 对 象 的 不 同 ， 其 统计 信息 可 到 不 同 的 视图 中 查看 。 这 部 分 涉及 的 数据 字典 比较 多 ， 如 表 4-2 所 示 。 


表 4-2 对象 统计 信息 数据 字典 


对 象 表 /索引 级 别 的 统计 分 区 级 别 的 统计 子 分 区 级 别 的 统计 


user tab statistics user tab statistics user tab statistics 
表 
user tables* user tab partitions* user tab subpartitions* 
user tab col statistics user part col statistics user subpart col statistics 
列 
user tab histograms user part histograms user subpart histograms 
user ind statistics user ind statistics user ind statistics 
直 喇 | 
NJ 


user indexes* user_ind partitions* user_ind subpartitions* 


带 有 星 号 的 表 主 要 在 9i 之 前 使 用 。 这 是 因为 视图 user_tab_statistics 和 user_ind_statistics 只 能 在 10g 上 使 用 。 


下 面 分 别针 对 表 、 列 和 索引 进行 举例 说 明 。 


1) 查看 表 的 统计 信息 : 


selecttable name, num rows，blocks，empty_blocks，avg_space，chain_cnt，avg_row_len， 
global stats, user stats, sample size, to char (t.last analyzed, 'yyyy-mm-dd') 

from dba tables t 

where owner='xxx' and table name="'xxx'; 


主要 字段 说 明 : 


` num_row: 数据 的 行 数 。 

“ blocks: 高 水 位 下 的 数据 块 个 数 。 

empty_block: 高 水 位 以 上 的 数据 块 个 数 。dbms_stats 不 计算 这 个 值 ， 被 设置 为 0。 

. avg_space: 数据 块 中 平均 空余 空间 ( 字 节 ) 。dbms_stats 不 计算 这 个 值 ， 被 设置 为 0。 
“ chain_cnt: 行 链接 和 行 迁移 的 数目 。dbms_stats 不 计算 这 个 值 ， 被 设置 为 0。 

“ avg_row_len: 行 平均 长 度 ( 字 节 ) 。 

' last_analyzed: 最 后 收集 统计 信息 时 间 。 


2) 查看 索引 的 统计 信息 : 


Select index name, uniqueness, blevel, leaf blocks, distinct keys, num rows, 
avg_leaf blocks per key, avg data blocks per key, clustering factor, global stats, 
user stats, sample size, to char (t.last analyzed, 'yyyy-mm-dd') 

from dba indexes 七 

wheretable owner="'xx' and table name='xx'; 


主要 字段 说 明 : 

.num_tows: 索引 行 。 

.leaf blocks: 索引 叶 块 数 。 

“distinct_keys: 索引 不 同 键 数 。 

:blevel: 索引 的 blevel 分 支 层 数 (bttee 的 深度 ， 从 root 节点 到 leaf 节 点 的 深度 。 如 果 root 节 点 也 是 leaf 节 点 ， 那 么 这 个 深度 就 是 0) 。 

“ avg leaf blocks_per key: 每 个 键 值 的 平均 索引 leaf 块 数 (每 个 键 值 的 平均 索引 leaf 块 数 (近似 取 整 ) ， 如 果 是 unique index 或 pk， 这 个 值 总 是 1) 。 
“ avg_data_blocks_per_key: 每 个 键 值 的 平均 索引 数据 〈 表 ) 块 数 。 

: clustering _factor: 索引 的 群集 因子 (索引 集群 因子 由 ) 。 


3) 查看 列 的 统计 信息 : 


selectcolumn name, num distinct, density, num buckets, num nulls, global stats, user stats， 
histogram, num buckets, sample size, to char (t.last analyzed, 'yyyy-mm-dd') a 

from dba tab cols t 

where owner='xx' and table name='xx'; 


主要 字段 说 明 : 


.num _distinct: 不 同 值 的 数目 。 


“ num_nulls: 字段 值 为 null 的 数目 。 

' density: 选择 率 。 

“histogram: 是 否 有 直方 图 统计 信息 。 如 果 有 ， 是 哪 种 类 型 。10g 以 后 才 提 供 。 
NONE: 没有 。 
“ FREQUENCY: 频率 类 型 。 
: HEIGHT BALANCED: 平均 分 布 类 型 。 

num_buckets: 直方 图 的 桶 数 。 

3. 修 改 统计 信息 


可 以 直接 通过 dbms_stats 包 的 相关 方法 设置 对 象 的 统计 信息 。 下 面 举例 说 明 。 


exec dbms_stats.set table stats (ownname=>'HF', tabname=>'EMP', 
numrows=>10000000, no invalidate=>false) ; 
人 了 HF.EMP 表 的 统计 项 numrows 为 1000 万 ， 参 数 no_invalidate 表 示 不 会 设置 相关 的 SQL 游 标 失 效 
的 
exec dbms stats.set index stats (ownname=>'HF', indname=>'IDX FMP', 
numlblks=>100000, no invalidate=>false) ; 
/* 这 个 例子 设置 了 HF.IDX_EMP 震 引 的 统计 项 numlblks 为 10 万 ， 参 数 no_invalidate 表 示 不 会 设置 相关 的 SQL 游 标 失效 
四 
/ 


4 删除 统计 信息 


类 似 上 面 收集 的 方法 ， 每 一 个 gather_xxx_stats 就 对 应 一 个 delete_xxx_stats 方 法 。 此 外 还 多 一 个 delete_column_stats 方 法 ， 专 门 用 来 删除 列 的 统计 信息 。 下 面 举例 说 明 。 


exec dbms_stats.delete table stats ('scott', 'employees') ; 
// 上 面 例子 删除 了 scott 用 户 下 employees 表 的 对 象 统计 信息 
exec dbms stats.delete index stats ('scott', 'employees pk') ; 


// 上 面 例子 删除 了 scott 用 户 下 employees_pk 索 引 的 对 象 统计 信息 
execdbms_stats.delete column stats ( 

ownname => user, 

tabname => 'T', 

colname => 'VAL', 

col stat type => 'HISTOGRAM') ; 

// 上 面 例子 删除 了 当前 用 户 下 ，T 表 的 VAL 字 段 的 直方 图 信息 


5. 锁 定 统计 信息 


从 10g 以 后 ， 可 以 明确 锁定 对 象 的 统计 信息 。 相 关 的 操作 包括 锁定 、 解 锁 、 查 看 锁定 状态 。 下 面 举例 说 明 。 


锁定 对 象 的 统计 信息 : 


dbms_stats.lock _ schema stats (ownname=>user) ; 
// 上 面 例子 锁定 了 当前 用 户 的 所 有 对 象 统计 信息 

dbms_stats.lock table stats (ownname=>user, tabname=>'T') ; 
// 上 面 例子 锁定 了 当前 用 户 的 T 表 统计 信息 


解锁 对 象 的 统计 信息 : 


dbms_stats.unlock schema stats (ownname=>user) ; 

// 上 面 例 子 对 当前 用 户 的 对 象 统计 信息 取消 锁定 

dbms_stats.unlock table stats (ownname=>user, tabname=>'T') ; 
// 上 面 例子 对 当前 用 户 的 T 表 统计 信息 取消 锁定 


查看 对 象 是 否 锁定 了 统计 信息 : 


selecttable name from user tab statistics where stattype locked is not null; 
// 查 看 当前 用 户 下 所 有 表 中 有 锁定 统计 信息 的 对 象 名 称 


4.2.3 ”数据 字典 统计 信息 
1. 收 集 统计 信息 


对 数据 字典 统计 信息 的 收集 ， 可 以 用 专门 的 方法 进行 收集 ， 也 可 以 按 普通 表 的 方式 进行 收集 。 下 面 举例 说 明 。 


exec dbms_ stats.gather dictionary stats; 
exec dbms_stats.gather table stats (ownname=>'SYS', tabname=>'TAB$', estimate percent=> 100, cascade=>true) ; 


2. 删 除 统计 信息 


类 似 收集 的 方法 ， 删 除 统计 信息 的 方法 也 有 两 种 。 


exec dbms stats.qelete dictionary stats; 

// 上 面 例子 删除 字典 对 象 统计 信息 

exec dbms_ stats.delete table stats (ownname=>'SYS', tabname=>'TAB$') ; 
// 上 面 例子 删除 SYS 用 户 TAB$ 表 的 统计 信息 


3. 查 看 统计 信息 


查看 统计 信息 就 按照 普通 对 象 进行 查询 即 可 ， 这 里 就 不 具体 介绍 了 。 
4.2.4 ”内 部 对 象 统计 信息 


对 内 部 对 象 统计 信息 的 收集 ， 可 以 用 专门 的 方法 进行 ， 也 可 以 按 普通 表 的 方法 进行 。 删 除 也 类 似 。 下 面 举例 说 明 。 


exec dbms stats.gather fixed objects stats () ; 

// 收 集 内 部 对 象 的 统计 信息 

exec dbms_ stats.gather table stats (ownname=>'SYS', tabname=>'X$KCCRSR', 
estimate percent=>100, cascade=>true) ; 

// 收 集 某 个 内 部 对 象 (SYS .XSKCCRSR) 的 统计 信息 

exec dbms_stats.delete fixed objects stats () ; 

// 删 除 内 部 对 象 的 统计 信息 

exec dbms_ stats.delete table stats (ownname=>'SYS', tabname=>'X$KCCRSR') ; 

// 删 除 某 个 内 部 对 象 (SYS .XSKCCRSR) 的 统计 信息 


四 一 个 度量 标准 , 用 于 索引 的 有 序 度 和 表 混 乱 度 之 间 的 比较 。 


第 5 章 。 SQL 解析 与 游标 


SQL 解析 是 数据 库 执 行 一 条 SQL 语句 的 必要 步骤 。 它 主要 完成 对 SQL 语句 的 各 种 分 析 、 检 查 ， 并 制定 执行 计划 。 最 后 将 执行 计划 交 由 执行 器 去 执行 即 可。 而 游标 是 作为 SQL 解析 的 结果 缓存 在 共享 池 中 ， 
可 作为 后 续 执 行 同一 SQL 时 直接 调用 使 用 。 这 里 所 说 的 游标 ， 不 要 和 PL/SQL 开 发 中 的 游标 混淆 。 这 里 的 游标 是 指 在 Oracle 中 解析 SQL 语句 生成 执行 计划 的 一 个 载体 ， 保 存在 共享 池 中 的 一 种 数据 结构 。 


下 面 对 SQL 解 析 的 过 程 简单 进行 描述 。 


5.1 解析 步骤 


司 5-1 是 Oracle 官 方 文档 的 一 张 SQL 解析 的 步骤 图 。 我 们 看 一 下 解析 过 程 做 了 哪些 操作 。 


SQL Statement 


PT i 


Parsing 


Syntax Check 
Semantic 
Check 
Shared Pool 
Check 


Hard Parse 


Creneration of Row Source 
query plan (reneration 


Execution 


图 5-1 SQL 解析 的 步骤 图 


Soft Parse 


Generation of 
multiple execu- 
tion plans 


图 5-1 中 涉及 的 命令 及 合 义 如 下 : 


“ Syntax Check: 语法 检查 。 数 据 库 会 检查 SQL 语句 的 语法 拼写 ， 以 保证 是 其 一 个 有 效 的 SQL 语句 。 常 见 的 错误 是 拼写 错误 ， 如 将 FROM 写成 FORM。 
“ Semantic Check: 语义 检查 。 数 据 库 会 对 SQL 语句 进行 语义 分 析 ， 其 中 包括 对 象 的 有 效 性 、 是 否 有 访问 权限 等 。 


“ Shared Pool Check: 数据 库 首先 将 SQL 文本 转化 为 ASCII 字 符 ， 然 后 根据 哈 希 算法 计算 其 对 应 的 值 (就 是 对 应 于 V$SQL.SQL_ID) 。 根 据 计 算出 的 这 个 值 到 共享 池 中 的 一 个 区 域 (就 是 library cache) 中 找 
到 对 应 的 一 块 结构 (又 称 bucket) ， 然 后 比较 bucket 里 是 否 存 在 该 SQL 语句 。 如 果 找 到 该 语句 ， 则 返回 对 应 的 执行 计划 〈 可 能 有 多 个 ， 需 要 选择 一 个 ) 。 如 果 没 有 找到 ， 则 进入 硬 解 析 的 过 程 。 


: Hard parse: 即 硬 解 析 。 如 果 数 据 库 无 法 在 内 存 中 找到 这 条 语句 ， 则 需要 经 历 一 个 硬 解 析 的 过 程 。 在 这 个 过 程 中 需要 申请 一 块 内 存 空间 (并 通过 名 叫 latch 的 结构 保证 不 被 别人 访问 ) 。 同 时 还 需要 访问 
数据 字典 获得 对 象 必要 的 信息 。 


“ Soft parse: 除去 Hard parse， 都 可 以 称 为 Soft parse。 
:Optimization: 在 这 一 阶段 ， 数 据 库 会 根据 很 多 因素 由 优化 器 生成 最 优 的 执行 计划 。 


“ Row Source Generation: 所 谓 Row Source 是 指 在 上 面 的 执行 计划 中 每 一 步 采用 什么 样 的 方法 去 关联 、 获 得 数据 。Row Source 可 能 对 应 于 表 、 视 图 、 结 果 集 、 表 关联 操作 、 分 组 操作 等 。 最 终结 果 是 一 棵 
树 的 形态 。 


“ Execution: 这 一 步 就 是 执行 器 根据 Row Source 树 的 每 一 步 去 执行 。 


5.2 解析 过 程 


上 面 我 们 简单 描述 了 一 下 SQL 语句 的 解析 步骤 ， 下 面 将 通过 一 幅 图 具体 说 明 整 个 解析 及 游标 查找 过 程 ， 如 图 5-2 所 示 。 


Parent Cursor Library Cache Object Handles 


Child Cursor 


图 5-2 SQL 解析 及 游标 查找 


首先 我 们 来 说 明 几 个 概念 。 前 面 讲 到 了 SQL 解析 ， 它 的 生成 结果 保存 在 库 高 速 缓存 中 。 保 存 的 对 象 我 们 称 为 库 缓存 对 象 (Library Cache Object) 。 所 有 的 库 缓 存 对 象 都 是 以 一 种 名 为 库 缓存 对 象 句柄 
(Library Cache Object Handles) 的 结构 保存 的 。 具 体形 式 上 ， 库 缓存 对 象 句 柄 是 以 哈 希 表 的 形式 存储 在 库 缓存 中 的 。 整 个 库 缓 存 可 以 看 成 是 一 组 哈 希 桶 (Hash Bucket) 组 成 的 。 


当 用 户 提交 一 条 SQL 语句 后 ， 优 化 器 会 根据 目标 SQL 的 文本 计算 一 个 哈 希 值 ， 然 后 去 库 缓存 中 找 匹 配 的 Hash Bucket。 如 图 5-2 中 所 示 的 步骤 @@。 这 里 需要 强调 一 点 ， 不 同 SQL 文 本 可 能 计算 的 哈 希 值 相 
同 。 此 外 ， 相 同 SQL 文 本 也 可 能 代表 的 是 不 同 的 语句 (后 面 会 看 到 这 样 的 示例 ) 。 


在 找到 对 应 的 Hash Bucket 后 ， 在 这 个 桶 的 后 面 是 一 个 Library Cache Object Handles 的 链表 。 链 表 中 的 每 一 个 Library Cache Object Handle 都 对 应 着 一 个 SQL 文本 解析 后 的 内 存 结构 (游标 ) 。 每 一 
个 Library Cache Object Handle 对 应 的 内 存 结构 都 可 分 为 一 个 Parent Cursor 和 若干 个 Child Cursor， 在 Parent Cursor 中 保存 有 指向 Child Cursor 的 指针 结构 。 在 Parent Cursor 中 保存 着 SQL 文本 ， 在 
Child Cursor 保 存 中 着 SQL 解析 树 和 执行 计划 ， 如 图 5-2 中 所 示 的 步骤 @。 


针对 每 个 Parent Cursor， 会 有 多 个 Child Cursor。 每 个 Child Cursor 都 对 应 一 套 SQL 执 行 计划 。 下 面 就 需要 遍历 这 个 Child Cursor 的 链表 ， 找 到 适合 的 Child Cursor 了 。 如 果 找 不 到 ， 会 生成 一 个 新 
的 ， 并 挂 在 Parent Cursor 的 下 面 ， 如 图 5-2 中 所 示 的 步骤 @)。 


下 面 我 们 分 别 看 看 不 同 的 解析 类 型 ， 对 应 于 上 面 的 结构 是 如 何 进行 的 。 


1. 硬 解析 


根据 上 面 所 述 ， 如 果 根 据 SQL 文 本 计算 的 哈 希 值 (sql_id) 无 法 在 库 高 速 缓存 中 找到 ， 则 开启 一 个 硬 解析 的 过 程 。 在 这 一 过 程 中 ， 首 先 需 要 在 共享 池 中 获取 一 个 栓 锁 (latch) ， 然 后 在 共享 池 的 可 | 
chunk 链 表 (也 就 是 bucket) 中 找到 一 个 可 用 的 chunk， 然 后 释放 latch。 在 获得 了 chunk 后 ， 这 块 latch 就 可 以 认为 是 进入 library cache 了 ， 从 而 开始 硬 解析 的 过 程 。 在 经 过 一 系列 的 步骤 后 ， 优 化 器 创建 
一 个 最 优 的 执行 计划 。 数 据 库 会 将 产生 的 执行 计划 、SQL 文 本 等 装载 进 library chache 中 的 若干 个 heap。 对 应 于 上 面 的 结构 ， 会 生成 一 个 Parent Cursor， 下 面 挂 着 一 个 Child Cursor。 


2. 软 解析 


如 果 在 bucket 中 找到 了 某 一 SQL 语句 ， 则 说 明 该 SQL 语句 以 前 运行 过 ， 于 是 进行 软 解析 。 软 解析 是 相对 于 硬 解析 而 言 的 。 如 果 解 析 过 程 中 ， 可 以 从 硬 解析 的 步骤 中 去 掉 一 个 或 多 个 的 话 ， 则 这 样 的 解析 
就 是 软 解析 。 它 又 可 以 细 分 为 三 种 类 型 : 


“ 类 型 -hard parse: 某 个 session 发 出 的 SQL 语句 与 ibrary cache 里 其 他 session 发 出 的 SQL 语 自 一 致 。 这 时 ， 该 解析 过 程 中 可 以 去 掉 硬 解析 中 某 些 步 又， 但 仍 要 进行 数据 字典 检查 、 名 称 转换 和 权限 检查 。 对 应 
于 上 面 的 结构 ， 就 是 找到 了 一 个 对 应 的 Parent Cursor， 后 续 操作 生成 一 个 Child Cursor 并 挂 在 其 他 Child Cursor 的 后 面 。 


“ 类 型 -soft parse: 某 个 session 发 出 的 SQL 语句 与 libraty cache 里 同一 个 session 之 前 发 出 的 SQL 语句 一 致 。 这 时 ， 该 解析 过 程 中 只 需要 进行 权限 检查 ， 因 为 可 能 通过 grant 改 变 了 该 session 用 户 的 权限 。 对 应 于 
上 面 的 结构 来 说 ， 就 是 在 Parent Cursor 下 挂 的 Child Cursor 找 到 了 你 所 需要 的 解析 结果 。 这 种 情况 可 以 省 略 很 多 解析 动作 ， 直 接 返回 结构 即 可 。 


“ 类 型 -soft soft parse: 当 设置 了 初始 化 参数 session_cached_cursors， 且 某 个 session 对 相同 的 cursor 进 行 第 三 次 访问 时 ， 将 在 该 session 的 PGA 里 创建 一 个 标记 ， 并 且 该 游标 即使 已 经 被 关闭 也 不 会 从 library 


cache 中 交换 出 去 。 这 样 ， 该 session 以 后 再 执行 相同 的 SQL 语句 时 ， 将 跳 过 硬 解 析 的 所 有 步骤 。 这 种 情况 是 最 高 效 的 解析 方式 ， 但 是 会 消耗 很 大 的 内 存 。 对 应 于 上 面 的 结构 来 说 ， 就 是 根本 不 需要 再 访问 共享 
池 ， 直 接 在 会 话 自 有 的 内 存 区 域 中 就 可 以 找到 解析 结果 。 这 是 效率 最 高 的 一 种 方式 。 


3 .解析 优化 


从 上 面 过 程 的 说 明 可 见 ， 数 据 库 硬 解析 的 过 程 就 是 生成 游标 的 过 程 ; 软 解析 的 过 程 就 是 找到 以 前 生成 的 游标 的 过 程 ; 软 解析 就 是 直接 在 客户 端 就 找到 了 缓存 在 本 地 的 游标 过 程 。 从 性 能 的 角度 而 言 ， 需 
要 尽 可 能 地 避免 发 生硬 解析 。 这 也 是 为 什么 数据 库 要 将 共享 游标 保存 在 库 缓存 中 的 原因 。 因 为 这 样 ， 属 于 这 个 实例 的 每 一 个 进程 都 可 以 重用 它们 。 


有 两 个 原因 可 以 解释 为 什么 硬 解析 的 开销 较 高 。 第 一 个 原因 是 硬 解析 过 程 很 长 ， 涉 及 大 量 复杂 操作 ， 这 些 都 非常 依赖 CPU 的 操作 。 第 二 个 原因 是 要 分 配 内 存 来 将 父 游标 与 子 游标 保存 在 库 缓存 中 。 由 于 
库 缓存 是 在 所 有 的 会 话 之 间 共 享 的 ， 库 缓存 中 的 内 存 分 配 必 须 串 行 执行 。 在 实际 操作 中 ， 在 分 配 父 游标 和 子 游 标 所 需 的 内 存 之 前 ， 必 须 取 得 一 个 保护 共享 池 的 门 锁 。 


从 


虽然 软 解析 的 影响 已 经 远 比 硬 解析 要 小 ， 但 还 是 需要 尽量 避免 软 解析 ， 因 为 它 也 会 导致 某 种 串 行 处 理 。 事 实 上 ， 为 了 所 有 共享 的 父 游 标 ， 也 必须 取得 一 个 保护 库 缓存 的 门 锁 。 总 的 来 刘 ， 需 要 尽 可 能 避 
免 硬 解析 和 软 解析 ， 因 为 它们 都 会 抑制 应 用 程序 的 可 扩展 性 。 


下 面 通过 一 个 示例 说 明生 成 游标 的 过 程 ， 大 家 也 可 以 从 操作 中 看 到 如 何 通过 数据 字典 查看 语句 缓存 的 游标 情况 。 


5.3 ”游标 示例 


下 面 我 们 来 看 一 个 关于 游标 的 示例 。 


以 SCOTT 用 户 身份 登录 数据 库 : 


conn scott/xxx 

select empno, ename from ex 

// 当 一 条 SQL 第 一 次 被 执行 的 时 候 ， Oracle 会 同时 产生 一 个 Parent Cursor 和 一 个 Child Cursor 

select sql text, sql id, version count 

from v$sqlarea 

where sql text like 'select empno, enames®'; 

SQL TEXT SQL ID VERSION_COUNT 

select empno, ename from emp 78bd3uh4a08av 

/* 目 标 SQL 在 V$SQLAREA 中 只 有 一 条 匹配 记录 ， 且 这 条 记 录 的 VERSION_COUNT 的 值 为 ] (VERSION hi Cursor 所 拥有 的 所 有 Child Cursor 的 数量 ) 。 这 说 明了 Oracle 在 执行 这 条 SQL 时 确实 只 产生 了 一 个 Par 
be 


select plan hash value, child number 
from v$sql | 
where sql id='78bd3uh4a08av'; 
PLAN_HASH VALUE CHILD NUMBER 
3956160932 0 
/* 从 V$SQL 中 查看 所 有 Child Cursor 的 信息 。 根 据 SQL ID 查询 VSSQL 只 有 一 条 匹配 记录 ， 而 且 这 条 记录 的 CHILD_NUMBER 的 值 为 0 (CHILD NUMBER 表 示 某 个 Child Cursor 所 对 应 的 子 游标 号 ) ， 说 明 Oracle 在 执行 原 目 标 SQL 时 
# 


/ 

// 以 HE 用 户 身份 登录 数据 库 

conn hf/hf 

create table emp as select * from scott.emp; 

select empno, ename from erp 

// 注 意 此 时 执行 的 SQL 语 和 句 虽 然 与 前 面 的 相同 ， 但 是 其 实 是 两 个 完全 不 同 的 语句 

select sql text, sql id, version count 

from v$sqlarea 

where sql text like 'select empno, ename%®'; 

SQL TEXT SQL ID VERSION_COUNT 
select empno, ename from emp 78bd3uh4a08av 2 
人 发 现 匹配 记录 的 VERSION_COUNTW 为 2， 说 明 这 个 SQL 语句 有 一 个 Parent Cursor 和 两 个 Child Cursor 


Cie plan hash value, child number from v$sql where sql id='78bd3uh4a08av' 
PLAN HASH VALUE CHILD 1 NUMBER 

3956160932 - 

3956160932 
// 查 看 V$SQL， 可 以 看 到 CHILD 1 NUMBER 的 值 分 别 为 0 和 1 的 两 个 Child Cursor 


对 于 上 面 这 个 例子 ， 第 一 条 SQL 在 SCOTT 用 户 下 执行 过 ， 在 Library Cache 中 已 经 生成 了 对 应 的 Parent 和 Child Cursor。 在 HF 用 户 执行 相同 文本 的 SQL 时 ，Oracle 根 据 上 述 SQL 文 本 的 哈 希 值 去 Library 
Cache 中 找 匹 配 的 Parent Cursor 时 肯定 能 找到 匹配 记录 。 但 接 下 来 遍历 从 属于 该 Parent Cursor 的 所 有 Child Cursor 时 ，Oracle 会 发 现 对 应 的 Child Cursor 中 存储 的 解析 树 和 执行 计划 此 时 是 不 能 被 重用 
的 ， 因 为 此 时 的 Child Cursor 里 存储 的 解析 树 和 执行 计划 针对 的 是 SCOTT 用 户 下 的 表 EMP， 而 后 面 执行 的 那个 SQL 对 应 的 是 HF 用 户 下 的 表 EMP。 这 里 查询 的 根本 就 不 是 同一 个 表 ， 解 析 树 和 执行 计划 当然 不 
能 共享 。 这 意味 着 Oracle 还 得 针对 上 述 SQL 从 头 再 做 一 次 解析 ， 并 把 解析 后 的 解析 树 和 执行 计划 存储 在 一 个 新 生成 的 Child Cursor 里 ， 再 把 这 个 Child Cursor 挂 在 上 述 Parent Cursor 下 〈 即 把 新 生成 的 
Child Cursor 的 库 缓存 对 象 句柄 地 址 添加 到 上 述 Parent Cursor) 。 也 就 是 说 ， 一 旦 上 述 SQL 执行 完毕 ， 该 SQL 所 对 应 的 Parent Cursor 下 就 会 有 两 个 Child Cursor: 一 个 Child Cursor 中 存储 的 针对 SCOTT 
户 下 表 EMP 的 解析 树 和 执行 计划 ; 另外 一 个 Child Cursor 中 存储 的 是 针对 HF 用 户 下 同名 表 EMP 的 解析 树 和 执行 计划 。 


第 6 章 ” 绑 定 变量 


绑 定 变量 是 数据 库 中 一 种 特殊 类 型 的 变量 ， 又 称 占 位 符 。 绑 定 变 量 通 常 出 现在 SQL 文本 中 ， 用 于 替代 WHERE 条 件 或 者 VALUES 子 句 的 具体 输入 值 。 


数据 库 引 入 绑 定 变量 ， 主 要 是 基于 以 下 几 个 方面 的 考虑 : 


“ 减少 硬 解析 : 对 于 一 个 高 并 发 的 系统 来 说 ， 硬 解析 会 严重 影响 系统 的 性 能 。 但 如 果 引 入 了 硬 解 析 ， 则 可 以 大 大 提高 SQL 语句 的 重用 度 ， 减 少 硬 解 析 的 次 数 ， 进 而 提高 系统 整体 性 能 和 可 扩展 性 。 当 然 
是 否 引入 硬 解 析 ， 也 要 取决 于 数据 库 的 类 型 。 对 于 OLTP 类 型 的 高 并 发 系统 是 适合 的 ， 但 对 于 OLAP/DSS 类 型 的 分 析 型 系统 ， 因 为 其 执行 SQL 较 少 ， 硬 解析 对 系统 性 能 影响 可 以 忽略 不 计 ， 因 此 就 不 必 使 用 绑 


定 变 量 了 。 


“ 提高 系统 伸缩 性 : 在 对 SQL 语句 进行 分 析 、 优 化 的 过 程 中 ， 很 多 操作 由 于 需要 申请 内 存 的 门 锁 结构 ， 导 致 不 能 并 发 进行 。 通 过 使 用 绑 定 变量 ， 可 以 更 高 效 地 使 用 内 存 ， 节 省 门 锁 申请 ， 从 而 整体 提供 
系统 的 可 伸缩 性 。 


: 提高 代码 可 读 性 : 因为 引入 了 绑 定 变量 ， 因 此 可 以 避免 拼接 式 的 硬 编码 ， 提 高 整体 可 读 性 。 


: 提高 代码 安全 性 : 通过 引入 绑 定 变量 ， 可 以 有 效 防止 SQL 注入 的 风险 ， 提 高 代码 安全 性 。 


下 面 我 们 首先 来 看 看 绑 定 变量 的 基本 使 用 方法 。 


6.1 使 用 方法 


我 们 可 以 在 多 种 环境 下 使 用 绑 定 变量 。 


TSQL 


下 面 看 看 在 SQL 中 如 何 使 用 绑 定 变量 。 


Var V_empno number; // 声 明 变 量 

exec : V_empno: =7369; // 变 量 赋值 

Select * from emp where empno=: V_empnoi // 执 行 查询 (引用 变量 ) 
2.PL/SQL: 


下 面 看 看 在 PL/SQL 中 如 何 使 用 绑 定 变量 。 


1) PLUSQL 中 静态 SQL 语句 使 用 绑 定 变量 : 


declare 
vc name varchar2 (10) ; 
begin 
execute immediate 'select ename from emp where empno=: 1' into vc name using 7369; 
dbms_output.put line (vc name) ; 
end; 


2) PL/SQL 中 动态 SQL 语句 使 用 绑 定 变量 : 


declare 

ve columnvarchar2 (10) ; 
vc_sqlvarchar2 (4000) ; 
n_temp number; 
VC_enamevarchar2 (10) ; 


begin 
Vc_column: ="empno ' ; 
ve_sql: ='delete from emp where '||vc colum||'=: 1 returning enameinto : 2'; 


execute immediate vc sql using 7369 returning into vc ename; 
dbms_output.put line (vc _ename) ; 
end; 


3) PL/SQL 中 通过 批量 绑 定 使 用 绑 定 变量 : 


declare 
Cur empsys_ refcursor; 
“vc _sql varchar2 (4000) ; 
typenamelist is table of varchar2 (10) ; 
enamesnamelist; 
CN_BATCH SIZE constant pls integer: =1000; 
begin 
ve_sql: ='select ename from emp where emp>: 1'; 
opencur emp for vc sql using 7900; 
loop 
fetchcur emp bulk collect into enames limit CN BATCH SIZE; 
for i in lhttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/. .enames.count loop 
dbms output.put line (enames (i) ) ; 
end loo; 
exit when enames.count<CN BATCH SIZE; 
end loop; 
closecur_emp; 
end; 


3.Java 


下 面 看 看 在 java 中 怎样 使 用 绑 定 变量 。 


1) Java 中 调用 静态 SQL 使 用 绑 定 变量 : 


String query="select empno, ename from emp where empno=7369"; 
pstmt=connect .prepareStatement (query) ; 

res=pstmt .executeQuery () ; 

String query="select empno, ename from emp where empno=?"; 
pstmt=connect .prepareStatement (query) ; 

pstmt .setIne (1, 7369) ; 

res=pstmt .executeQuery () ; 


2) Java 中 通过 批量 绑 定 使 用 绑 定 变量 : 


String dml="update emp set sal=? whereempno=?"; 
pstmt=connection.prepareStatement (dml) ; 
pstmt.clearBatch () ; 

for (int i=0; i<UPDATE COUNT; ++i) 

{ 

pstmt.setInt (1, generateEmpno (i) ) ; 
pstmt.setIne (2, generateSal (i) ) ; 
pstmt .addBatch () ; 

} 

pstmt .executeBatch () ; 
connection.commit () ; 


// 这 段 代码 使 用 的 是 批量 绑 定 的 方式 


因为 引入 了 绑 定 变量 ， 对 于 SQL 解析 而 言 会 带 来 一 些 变化 。 下 面 针对 带 有 绑 定 变量 的 SQL 解析 问题 加 以 说 明 。 


6.2 ” 绑 定 变量 与 解析 


我 们 通过 一 个 示例 看 一 看 带 有 绑 定 变量 的 SQL 语句 解析 。 


create table tl as Select * from dba objects; 
Varv name varchar2 (30) 

exec : V_name: ='T1' 

select * from tl where object name=: v_name; 


SQL> select sql id, address, hash value , plan _ hash value , child number 

2 fromv$sql I 

3 wheresql text like 'select * from tl where object name=: Vv_name'; 

SQL ID ADDRESS HASH VALUE PLAN HASH VALUE CHILD NUMBER 
6g1g39543bkvc 000007FF3769DB00 1211485036 3617692013 0 
SQL> select * from table (dbms xplan.display cursor ('6g1g39543bkvc' 


0 | SELECT STATEMENT | | | 74 (100) | | 
I* 1 | TABLE ACCESS FULL | T1 | :| 621 | 74 《0 1 8 O07 A | 


Peeked Binds (identified by position) 


1 - :VNAME (VARCHAR2 (30) , CSID=873) : 'T1' 


从 上 面 这 个 例子 可 见 ， 对 一 个 带 有 绑 定 变量 的 语句 而 言 ， 也 是 可 以 显示 其 执行 计划 的 。 并 且 ， 在 执行 计划 中 有 单独 的 一 个 部 分 ， 显 示 使 用 绑 定 变量 的 情况 。 这 里 大 家 可 能 会 有 一 个 疑问 ， 就 是 带 有 绑 定 
变量 的 语句 在 解析 时 ， 如 何 得 到 这 个 执行 计划 ? 这 里 就 引入 了 一 个 重要 的 概念 一 一 绑 定 变量 寅 视 。 


1 名 定 变量 病 视 


首先 我 们 来 明确 一 下 ， 绑 定 变量 窥视 的 概念 。 在 数据 库 生成 执行 计划 的 时 候 ， 需 要 根据 条 件 判断 数据 的 访问 规模 ， 从 而 指出 最 优 的 访问 路 径 。 当 使 用 的 是 带 有 绑 定 变量 的 SQL 语句 时 ，Oracle 会 在 第 一 
次 解析 SQL 语句 的 时 候 ， 将 绑 定 变量 的 输入 值 带 到 SQL 语句 中 ， 从 而 根据 其 字面 值 来 估算 返回 的 记录 数 ， 从 而 得 到 执行 计划 。 当 再 次 执行 相同 的 SQL 语句 时 ， 就 不 用 再 考虑 绑 定 变量 的 输入 值 了 ， 直 接 沿用 过 
去 的 执行 计划 即 可 。 


下 面 我 们 通过 一 个 示例 演示 一 下 绑 定 变量 窥视 。 


Create table tl as Select object id as id, object name from dba objects where rownum<=10001; 
update t1 set idq=1 where rownum<=10000; 
commit; 
create index idx tl on tl (id) ; 
// 创 建 一 个 表 ， 然 后 通过 数据 更 新 使 id 字段 的 数据 分 布 不 均匀 ， 并 在 该 字段 上 创建 一 个 索引 
execdbms_stats.gather _ table stats (User，'t1'，cascade =>true，method opt => 'for columns id size 254") ; 
// 收 集 一 下 统计 信息 。 注 意 ， 这 里 要 收集 直方 图 ， 为 的 是 让 CBO 知 道 1d 列 上 的 数据 分 布 不 均匀 
select max (id) from tl1 where rownum<10; 
MAX (ID) 
10312 
varv_id number; 
exec : v id : = 10312; 
select * from tl where id=: v id; 
selectsql id， address, hash value , Plan hash value , child number 


fromv$sql 
wheresql text like 'select * from tl where id=: v_id%'; 
SQL ID ADDRESS HASH VALUE PLAN HASH VALUE CHILD NUMBER 
7Y7tt6xyhas1g 000007FF32B13C28 2097504303 50753647 0 
select * from table (dboms xplan.display cursor ('7y7ttéxyhas1lg', 0, 'peeked binds') ) ; 
| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT | | 1 | 2 (100) 1 | 
| 1 | TABLE ACCESS BY INDEX ROWID 

| T1 | | 21 1 2 Oy DO 007 01 ] 
| 车 这: 二 INDEX RANGE SCAN | IDX T1 | | 1 灿 (0) | 00: 0 


Peeked Binds (identified by position) 
1-:VID (NUMBER) : 10312 

/* 从 上 面 的 辆 出 可 见 ， 这 里 使 用 了 索引 范围 扫描 的 方式 。 对 于 这 条 语句 来 说 (ID=10312) ， 这 是 一 个 不 错 的 执行 计划 

要 从 

exec : Yid ;= 1 

select * from tl where id=: v _ id; 

select * from table (doms xplan.display cursor ('7y7tt6xyhas1lg', 


'peeked binds') ) ; 


| 0 | SELECT STATEMENT | | | | 2 (100) | | 
| 1 | TABLE ACCESS BY INDEX ROWID 

LE | | 21 1 2 (0 1 ‘00r DO 0 1 
| INDEX RANGE SCAN | IDX T1 | | | 1 (0) | 00: 00: 01 | 


Peeked Binds (identified by position) 


1-:VID (NUMBER) : 10312 
/* 从 上 面 可 以 看 出 ， 执 行 计划 没有 变化 。 我 们 知道 ， 对 于 ID=1 的 记录 是 绝 大 多 数 ， 全 表 扫 描 对 这 个 语句 来 说 是 一 种 更 优 的 选择 。 从 下 面 的 绑 定 变量 可 知 ， 生 成 这 个 执行 计划 的 绑 定 变量 还 是 第 一 次 执行 时 的 10312， 也 就 是 说 绑 定 变 
Sf 


Wp 从 上 面 结果 可 以 看 出 ， 在 为 绑 定 变量 传 入 第 一 个 值 为 10312 时 ， 由 于 返回 的 记录 条 数 较 少 ， 导 致 走 索引 扫描 。 当 我 们 第 二 次 传 入 绑 定 变量 值 1 时 ，Oracle 不 再 生成 新 的 执行 计划 ， 而 直接 拿 索引 扫描 的 执行 路 径 来 用 。 但 是 ， 


为 了 解决 上 面 的 问题 ， 在 119g 及 以 后 的 版 本 中 ， 引 入 了 自 适 应 的 绑 定 变量 寅 视 。 下 面 通过 示例 说 明 。 


Select * from tl where i V_ id 
Select * from tl] Where i V_ id 
Select * from tl where i V id 


// 重 复 上 面 的 例子 ， 多 执行 几 次 这 个 语句 
selectsq] text, sql id, child number, plan hash value from v$sql where sql text like "select * from tl1 where%s'; 
SQL TEXT SQL ID CHILD NUMBER 


select 
Select * from tl where id=: V 
// 由 此 处 可 见 ， 对 于 这 一 条 语句 生成 了 两 个 执行 计划 

select * from table (doms xplan.display cursor ('7y7tt6xyhas1lg', 0, 'peeked binds') ) ; 


7y7tt6xyhaslg 0 
7y7tt6xyhaslg 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT 1 | | | 2 (100) | | 
| 1 | TABLE ACCESS BY INDEX ROWID 
| T1 | 1 | 21 | 2 (0) | 00: 00: 01 | 
[| INDEX RANGE SCAN | IDx Tl1 | ,| | 和 《Oh -00 oos QL 1 


Peeked Binds (identified by position) 


: VID (NUMBER) : 10312 
// 对 于 绑 定 变量 传 入 的 值 为 10312， 此 时 走 的 索引 范围 扫描 
select * from table (dbms xplan.display cursor ('7Y7tt6xyhas1g'，1，'pPeeked binds') ) ; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT | | | | 13 (100) | | 
I* 1 | TABLE ACCESS FULL | T1 | 10000 | 205K| 13 《9 | 002 00: 0L | 


Peeked Binds (identified by position) : 
1-:VID (NUMBER) : 1 

// 对 于 绑 定 变量 传 入 的 值 为 1， 此 时 走 的 全 表 扫 描 。 

人 在 11g 中 引入 了 自 造 应 的 游标 策略 ， 根 据 不 同 的 输入 值 ， 可 以 对 应 不 同 的 执行 计划 ， 这 大 大 提高 了 适应 情况 。 但 需要 注意 的 是 ， 前 提 条 件 是 绑 定 变 量 对 应 的 字段 收集 了 直方 图 。 这 一 点 可 以 理解 ， 如 果 不 收 集 的 话 ， 是 无 法 失 


除了 上 面 这 种 情况 ， 因 为 数据 有 倾斜 导致 一 条 SQL 语句 可 能 有 不 同 执行 计划 的 情况 外 ， 还 有 一 种 情况 会 导致 这 种 现象 。 这 就 是 绑 定 变量 分 级 ， 下 面 针 对 这 种 情况 加 以 说 明 。 


2 绑 定 变量 分 级 


所 谓 的 绑 定 变量 分 级 ， 是 指 Oracle 数 据 库 会 根据 绑 定 变量 的 长 短 将 绑 定 变量 分 为 不 同 的 级 别 。 


create table tl as select rownumid, object name from dba objects; 
alter table tl modify name varchar2 (255) ; ey 
varv_name varchar2 (30) 

exec : V_name: ='ABC' 

select * from tl where name=: V_name; 

selectsql id, hash value , child number, executions 


fromv$sql 

wheresql text like 'select * from tl where name=: Vv_name!' 

SQL ID HASH VALUE CHILD NUMBER EXECUTIONS 
80au64833mru6 104456006 0 1 


// 我 们 执行 了 一 条 SQL 语 句 ， 优 化 器 生成 了 一 个 游标 

varv name varchar2 (200) 

exec : V_name: ='ABC! 

select * from tl] where name=: Vv name; 

selectsql id, hash value ， child number, executions 


fromv$sql 

wheresql text like 'select * from tl where name=: V_name" 

SQL ID HASH VALUE CHILD NUMBER EXECUTTIONS 
80au64833mru6 104456006 9 1 
80au64833mru6 104456006 二 


对 


/* 尽 管 这 次 执行 的 语句 和 前 面 的 完全 一 样 ， 但是 才 据 库 生成 了 两 个 不 同 的 游标 我 们 可 以 通过 下 面 的 语句 查看 为 什么 生成 了 两 个 


四 
selects.child number, m.position, m.max length, 
decode (m.datatype, 1, 'VARCHAR2', 2, 'NUMBER', m.datatype) as datatype 

fromv$sqls, v$sql bind metadata m 
wheres.sql id='80au64833mru6' and s.child adqress=m.address 
order by 1, 2; 
CHILD NUMBER POSITION MAX LENGTH DATATYPE 

， 9 128 VARCHAR2 

1 2000 VARCHAR2 

/7 从 上 面 输出 可 以 看 出 ， 两 个 游标 是 因为 最 大 长 度 不 同 ， 导 致 生成 了 不 同 的 游标 


于 不 同 级 别 的 绑 定 变量 ， 会 对 应 不 同 的 子 游标 。 下 面 通过 一 个 示例 说 明 这 种 现象 。 


总 结 一 下 ， 绑 定 变量 分 级 是 Oracle 根 据 文 本 型 绑 定 变量 的 长 度 分 为 若干 级 别 。 即 使 SQL 语句 相同 ， 


第 一 个 等 级 : 长 度 在 32 字 节 (Byte) 以 内 。 
“第 二 个 等 级 : 长 度 在 33~128 字 节 之 间 。 
第 三 个 等 级 : 长 度 在 129~2000 字 节 之 间 。 


“ 第 四 个 等 级 : 长 度 在 2000 字 节 以 上 。 


但 是 只 要 长 度 不 同 就 仍然 生成 新 的 游标 。 系 统 是 分 为 四 个 级 别 : 


除了 上 面 这 种 显 式 使 用 绑 定 变量 的 情况 ， 数 据 库 也 会 考虑 在 某 些 情况 下 自动 使 用 绑 定 变量 蔡 换 原来 的 值 。 这 种 技术 称 为 游标 共享 ， 下 面 详细 说 明 。 


6.3 游标 共享 as 


游标 是 否 共 享 是 通过 参数 cursor sharing 来 控制 的 。 下 面 分 别 说 明 这 个 参数 几 种 取 值 的 含义 。 


“ EXACT: 只 有 当 发 布 的 SQL 语句 与 缓存 中 的 语句 完全 相同 时 才 用 已 有 的 执行 计划 。 


:FORCE : 如 果 SQL 语句 是 字面 量 ， 则 迫使 Dptimizer 始 终 使 用 已 有 的 执行 计划 ， 无 论 已 有 的 执行 计划 是 不 是 最 佳 的 。 优 化 器 将 把 SQL 语句 所 有 字面 常量 替换 为 系统 产生 的 绑 定 变量 ， 并 检查 是 否 存在 一 


个 以 前 产生 的 共享 游标 以 用 于 修改 后 的 语句 。 


“ SIMILAR: 如 果 SQL 语句 是 字面 量 ， 则 只 有 当 已 有 的 执行 计划 是 最 佳 时 才 使 用 它 ， 如 果 已 有 执行 计划 不 是 最 佳 则 重新 对 这 个 SQL 语 白 进 行 分 析 来 制定 最 佳 执行 计划 。 首 先 将 字面 变量 替换 为 绑 定 变量 ， 
然后 窥视 绑 定 变量 的 值 。 如 果 有 必要 ， 将 对 该 语句 每 次 单独 的 分 析 调 用 中 输入 值 进行 优化 。 该 参数 指定 Oracle 在 存在 柱状 图 信息 时 ， 对 于 


执行 计划 。 即 当 存 在 柱状 图 时 ，similat 的 表现 和 exact 一 样 ; 当 柱 状 图 不 存在 时 ，similat 的 表现 和 force 相 同 。 


下 面 通过 一 个 例子 说 明 。 


不 同 的 变量 值 ， 重 新 解析 ， 从 而 可 以 利用 柱状 图 更 为 精确 地 指定 SQL 


create table tl as select rownum id , object name name from sys.dba objects; 
show parameter cursor sharing=> FORCE | 

select * from tl1 where id=1; 

selectsql] text, sql id, version count, executions 

fromv$sqlarea 

wheresql] text like 'select * from tl1%'; 

SQL TEXT SQL ID VERSION COUNT EXECUTIONS 
select * from tl where id=: "SYS_B 0" 6800d8tpghk0c 于 
// 在 CURSOR SHARING 为 FORCE 的 情况 下 ，Oracle 强 制 使 用 了 绑 定 变量 ， 甚 至 直接 改写 和 

alter session set cursor sharing=EXACT; 

grant select on tl to sys; 

// 通 过 这 种 方式 淘汰 了 已 经 生 瞩 的 执行 计划 

Select * from tl] where id=1; 

select sql text, sql id， version count, executions 

from v$sqlarea 

where sql text like 'select * from tl1%'; 

SQL TEXT 加 SQL ID VERSION COUNT EXECUTIONS 


select * from tl where id=1 Sag8kthgnvjk2 业 1 


/* 再 次 执行 上 面 的 SQL， 可 见 在 CURSOR_SHARING=EXACT 的 情况 下 ， 绝 对 精确 匹配 文本 ， 没 有 使 用 绑 定 变量 


Rf 


第 7 章 SQL 优化 相关 对 象 


在 对 进行 SQL 优 化 的 过 程 中 ， 首 先 需 要 了 解 语句 相关 对 象 的 情况 。 数 据 库 对 象 设计 的 好 坏 ， 
象 的 结构 来 完成 优化 。 


下 面 我 们 将 分 别 介绍 与 SQL 优 化 相关 的 一 些 对 象 。 首 先 ， 来 看 看 大 家 最 为 熟悉 的 对 象 一 一 表 。 


会 直接 


影响 相关 对 象 语句 执行 的 效率 。 因 


此 ， 有 时 在 SQL 语句 实 在 无 法 优化 的 情况 下 ， 可 以 考虑 通过 修改 对 


7.1 表 


“ 表 ” 是 大 家 最 为 熟知 的 一 个 对 象 。 它 也 是 保存 数据 的 实体 。 在 Oracle 数 据 库 中 ， 支 持 多 种 表 的 类 型 。 大 家 最 为 常见 的 就 是 堆 表 ， 它 也 是 适用 领域 最 广 的 一 种 表 。 此 外 还 支持 索引 组 织 表 、 簇 表 等 。 除 
了 按照 表 的 结构 分 类 外 ， 还 可 以 根据 表 的 组 织 形式 、 用 途 等 进行 分 类 ， 比 如 常见 的 分 区 表 、 临 时 表 等 。 


下 面 我 们 将 从 最 常见 的 堆 表 开始 介绍 。 


1. 堆 表 


堆 表 是 Oracle 默 认 的 表 类 型 ， 也 是 最 常用 的 表 类 型 。 除 非 有 特殊 原因 要 使 用 其 他 表 类 型 ， 否 则 都 使 用 堆 表 类 型 。 作 为 堆 表 来 说 ， 最 常见 的 影响 性 能 的 因素 就 是 表 的 规模 。 这 一 点 很 容易 理解 ， 规 模 越 
大 ， 扫 描 的 块 数 越 多 ， 当 然 成 本 也 就 越 高 。 前 面 两 章 提 到 过 ， 如 果 对 表 进 行 全 表 扫 描 的 话 ， 会 扫描 高 水 位 线 以 下 的 所 有 块 。 这 也 解释 了 为 什么 DELETE 数 据 后 ， 扫 描 表 仍然 很 慢 。 下 面 通过 一 个 示例 说 明 。 


SQL> create table tl as select * from dba objects; 
// 表 已 创建 
SQL> insert into tl1 select * from tl1; 
// 已 创建 18865 行 
SQL> insert into tl1 select * from tl1; 
// 已 创建 37730 行 
SQL> insert into tl1 select * from t1; 
// 已 创建 75460 行 
SQL> insert into tl1 select * from tl1; 
// 已 创建 150920 行 
SQL> commit; 
/ /提交 完成 
// 这 里 我 们 构造 一 张大 表 ， 并 插入 了 几 十 万 条 记录 
SQL> set serveroutput on 
SQL> exec show space ('t1', 'auto' 
Total Blockshttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/. .http://www.hzcourse.com/resource/readBook?path=/openresour 
Total Byteshttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/. .http://www.hzcourse.com/resource/readBook?path=/openresourc 
Unused Blockshttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/. .http://www.hzcourse.com/resource/readBook?path=/openresov 
Unused Byteshttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/..http://www.hzcourse.com/resource/readBook?path=/openresour 
Last Used Ext FileIdhttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/. .http://www.hzcourse.com/resource/readBook?path=/oF 
Last Used Ext BlockIdhttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/O0EBPS/Text/..http://www.hzcourse.com/resource/readBook?path=/c 
Last Used Blockhttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/..http://www.hzcourse.com/resource/readBook?path=/openres 
PL/SQL 过 程 已 成 功 完成 。 
/* 这 里 我 们 调用 了 一 个 存储 过 程 ( 附 录 中 会 详细 说 明 ) 。 通 过 这 个 存储 过 程 ， 我 们 可 以 观察 到 表 的 高 水 位 线 信 
* 
/ 
SQL> set autotracetraceonly 
SQL> select count (*) from tl1; 


息 。 对 于 上 面 这 个 示例 ， 高 水 位 线 的 位 置 在 Total Blocks - Unused Blocks = 4096 


| Id | Operation | Name | Rows | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT 1 | |] (2) | 00: 00: 14 | 
| 1 | SORT AGGREGATE | h 二] | 

| 2 1 TABLE ACCESS FULL| T1 | 4559K| 1115 (2) | 00: 00: 14 | 


统计 信息 


5903 consistent gets 
4059 physical reads 
// 通 过 上 面 执 行 的 SQL 语 句 可 见 ， 这 个 查询 语句 大 约 要 执行 5000 多 次 逻辑 读 操 作 

SQL> delete from 七 1; 

// 已 删除 301840 行 

SQL> commit; 

// 提 交 完 成 

SQL> exec show space ('t1'，'"auto') ; 

Total Blockshttp://www.hzcourse.com/resource/readBook?path=/openresources/teach_ebook/uncompresseq/15654/OEBPSVText/. .http://www.hzcourse.com/resource/readBook?path=/openresour 
Total Byteshttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/. .http://www.hzcourse.com/resource/readBook?path=/openresourc 
Unused Blockshttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/. .http://www.hzcourse.com/resource/readBook?path=/openresov 
Unused Byteshttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/. .http://www.hzcourse.com/resource/readBook?path=/openresour 
Last Used Ext FileIdhttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/..http://www.hzcourse.com/resource/readBook?path=/oF 
Last Used Ext BlockIdhttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/. .http://www.hzcourse.com/resource/readBook?path=/c 
Last Used Blockhttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/..http://www.hzcourse.com/resource/readBook?path=/openres 
//PL/SQL 过 程 已 成 功 完成 

/ /删除 操作 后 ， 我 们 通过 观察 发 现 高 水 


Id | Operation | Name | Rows | Cost (%CPU) | Time 

| 0 | SELECT STATEMENT 1 和 

| 1 | SORT AGGREGATE | | 工 ] | | 
| 2 让 


| TABLE ACCESS FULL| T1 | | 1096 (1) | 00: 00: 14 | 


0 recursive calls 

0 db block gets 

5166 consistent gets 

4026 physical reads 

// 删 除 之 后 执行 查询 ， 仍 然 需要 5000 多 次 的 逻辑 读 操 作 
SQL> truncate table tl1; 
// 表 被 截断 

SQL> set autotrace off 

SQL> exec show space ('"t1'，"auto') ; 

Total Blockshttp://www.hzcourse.com/resource/TreadBook?path=/openresources/teach_ebook/uncompressed/15654/OERBPSVText/. .http://www.hzcourse.com/resource/readBook?path=/openresour 
Total Byteshttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/O0EBPS/Text/. .http://www.hzcourse.com/resource/readBook?path=/openresourc 
Unused Blockshttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/. .http://www.hzcourse.com/resource/readBook?path=/openresov 
Unused Byteshttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/. .http://www.hzcourse.com/resource/readBook?path=/openresour 
Last Used Ext FileIdhttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/. .http://www.hzcourse.com/resource/readBook?path=/oF 
Last Used Ext BlockIdhttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/O0EBPS/Text/..http://www.hzcourse.com/resource/readBook?path=/c 
Last Used Blockhttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/..http://www.hzcourse.com/resource/readBook?path=/openres 
//PL/SQL 过 程 已 成 功 完成 

// 截 断 表 后 ， 高 水 位 线 明 显 降 低 了 

SQL> select count (*) from 七 1; 


| Id | Operation | Name | Rows | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT | | 二 2 人 91003002 01 | 
| 1 | SORT AGGREGATE | | 1 | | 

| 2 1 TABLE ACCESS FULL| T1 | 1 2 | 


统计 信息 


recursive calls 

db block gets 

consistent gets 

physical reads 

* 高 水 位 线 降低 后 ， 再 次 执行 查询 语句 ， 可 见 其 逻辑 读 非常 小 。 这 也 说 明了 降低 高 水 位 线 对 全 表 扫 描 的 影响 


+4 一 PPAOPI 
5 


2. 索 引 组 织 表 


索引 组 织 表 ， 顾 名 思 义 ， 就 是 存储 在 一 个 索引 结构 中 的 表 ， 也 就 是 以 B+ 树 结构 存储 。 换 名 话说， 在 索引 组 织 表 中 ， 索 引 就 是 数据 ， 数 据 就 是 索引 ， 两 者 合 二 为 一 。 索 引 组 织 表 的 好 处 并 不 在 于 解决 磁盘 
空间 的 占用 ， 更 重要 的 是 可 以 降低 /O， 进 而 减少 访问 缓冲 区 缓存 。 


下 面 我 们 通过 一 个 示例 说 明 普 通 堆 表 与 索引 组 织 表 的 访问 对 比 。 


SQL> create table t normal ( aint, bint, c varchar2 (100) ) ; 

// 表 已 创建 

SQL> create index idx normal a on t normal (a) ; 

// 索 引 已 创建 

SQL> insert into t normal select rownum, object id, object name from dba objects; 
// 已 创建 18867 行 

SQL> commit; 


// 提 交 完 成 

SQL> create table t iot (a int，bint，c varchar2 (100) , primary key (a) ) organization index; 
// 表 已 创建 

SQL> insert into t iot select rownum, object id, object name from dba objects; 

// 已 创建 18869 行 

SQL> commit; 

// 提 交 完 成 

// 上 面 分 别 创建 了 普通 表 和 索引 组 织 表 ， 并 插入 了 相同 数据 

SQL> set autotracetraceonly 

SQL> select * from t normal where a=1000; 


| 0 | SELECT STATEMENT | | | 78 | 1 (0) | 00: 00 
| 1 | TABLE ACCESS BY INDEX ROWID 
| T_NORMAL | 11 78 | 1 (0) | 00: 00 
[| INDEX RANGE SCAN | IDX NORMAL A | 74 | 1 1 (0) | 00: 00 
一 -一 统计 信息 

0 recursive calls 
0 db block gets 
4 consistent gets 
0 physical reads 
// 从 上 面 可 见 ， 在 堆 表 中 访问 这 条 记录 需要 4 个 逻辑 读 操作 。 从 执行 计划 可 见 ， 需 要 一 个 回 表 查询 
SQL> select * from t iot where a=1000; 
| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time 
| 0 | SELECT STATEMENT 

| | | | 1 0% 1 DG O00 0 | 
I* 1 | INDEX UNIQUE SCAN 

| SYS IOT TOP 21676 | | 78 | 下 《Qi 1 00: 002 OL |] 


统计 信息 


1 recursive calls 
0 db block gets 
2 consistent gets 
0 physical reads 
全 村 在 索引 组 织 表 中 访问 这 条 记录 需要 2 个 逻辑 读 ， 这 个 较 堆 表 访问 大 大 减少 了 。 从 执行 可 见 的 ， 可 以 直接 访问 ， 不 需要 回 表 ; 或 者 说 ， 就 是 通过 索引 直接 访问 数据 


3. 分 区 表 


分 区 表 是 Oracle 数 据 库 中 应 对 大 规模 数据 量 的 一 种 很 好 的 解决 方案 。 其 基本 原理 很 简单 ， 就 是 将 大 的 对 象 分 解 为 若干 个 小 对 象 。 当 访问 表 时 ， 根 据 分 区 策略 ， 可 以 精确 地 定位 到 小 对 象 (单个 分 区 ) ， 
进而 提高 访问 效率 。 需 要 说 明 的 是 ， 分 区 表 中 的 每 个 分 区 也 是 一 个 独立 的 堆 表 。 只 是 逻辑 上 看 起 来 是 一 张 完整 的 表 。 


下 面 通过 一 个 示例 说 明 普 通 表 与 分 区 表 的 访问 区 别 。 


[hf@testdb] SQL> create table t part 
( 


2 
3 owner varchar2 (30) ， 
4 object namevarchar2 (128) ， 
六 object_id number, 
6 created date 
A 
8 partition by range (created) 


9 

10 partition part 201305 values less than (to date ('2013-06-01', 'yyyy-mm-dd') 
11 partition part 201306 values less than (to date ('2013-07-01', 'yyyy-mm-dd') 
12 partition part 201307 values less than (to date ('2013-08-01', 'yyyy-mm-dd') 
13 partition part 201308 values less than (to date ('2013-09-01', 'yyyy-mm-dd') 
14 partition part 201309 values less than (to date ('2013-10-01', 'yyyy-mm-dd') 
15 partition part 201310 values less than (to date ('2013-11-01', 'yyyy-mm-dd') 
16 partition part 201311 values less than (to date ('2013-12-01', 'yyyy-mm-dd') 
17 partition part 201312 values less than (to date ('2014-01-01', 'yyyy-mm-dd') 
18 partition part 201401 values less than (to date ('2014-02-01', 'yyyy-mm-dd') 
19 partition part 201402 values less than (to date ('2014-03-01', 'yyyy-mm-dd') 
20 partition part 201403 values less than (to date ('2014-04-01', 'yyyy-mm-dd') 
21 partition part 201404 values less than (to date ('2014-05-01', 'yyyy-mm-dd') 
22 partition part 201405 values less than (to date ('2014-06-01', 'yyyy-mm-dd') 
23 partitionpart max values less than (maxvalue) 

24 让 

Table created. 

[hf@testdb] SQL> create table t normal 

2 


owner varchar2 (30) ， 
object namevarchar2 (128) ， 
object_ id number, 

created date 


map 


了 宙 

Table created. 

hf@testdb] SQL> insert into t normal select owner, object name, object id, created from sys.dba objects; 
86299 rows created. 

hf@testdb] SQL> commit; 

Commit complete. 

hf@testdb] SQL> insert into t part select owner, object name, object id, created from sys.dba objects; 
86299 rows created. - 
hf@testdb] SQL> commit; 

Commit complete. 


// 上 面 创建 了 两 张 表 ， 并 插入 了 数 万 条 记录 


hf@testdb] SQL> exec dbms stats.gather table stats ('hf', 't normal'); 
PL/SQL procedure successfully completed. 
hf@testdb] SQL> exec dbms stats.gather table stats ('hf', 't Part') ; 


PL/SQL procedure successfully completed. 
hf@testdb] SQL> select * from t part where created between to date ('2013-11-01', 'yyyy-mm-dd') and to date ('2013-11-30', 'yyyy-mm-dd') ; 


0 | SELECT STATEMENT | 上 1 11051 2 《0 1 00 00r .01 | 

1 | PARTITION RANGE SINGLE | | 2 (0) | 00: 00: 011 举人 党 
| TABLE ACCESS FULL IT -PARTI 3] 105 | 2 (0) | 00: 00: 011 人 
Statistics 


1 recursive calls 

0 db block gets 

0 consistent gets 

0 physical reads 

// 对 分 区 表 的 访问 可 见 ， 没 有 消耗 逻辑 读 。 原 因 是 该 分 区 内 没有 数据 ， 因 此 无 须 读 取 

[hf@testdb] SQL> select * from t normal where created between to date ('2013-11-01', 'yyyy-mm-dd') and to date ('2013-11-30', 'yyyy-mm-dd') ; 
| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time L 

| 0 | SELECT STATEMENT | | 75.1 3300 1 171 (1) | 

I* 1 | TABLE ACCESS FULL | T NORMAL | 75°1 3300 1 171 (1) | 

Statistics 


12 recursive calls 

0 db block gets 

643 consistent gets 

0 physical reads 

0 果 直 接 对 表 进 行 访问 ， 则 需要 600 多 次 的 到 辑 读 。 由 此 可 见 ， 通 过 分 区 访问 可 以 更 精确 地 定位 数据 ， 减 少 访问 规模 
# 


7.2 字段 


字段 对 象 对 于 SQL 语句 的 执行 效率 也 有 很 大 的 影响 。 影 响 因素 主要 体现 在 两 个 方面 一 一 字段 存储 顺序 和 字段 类 型 。 下 面 分 别 说 明 。 


1. 字 段 存储 顺序 


字段 存储 顺序 会 影响 访问 性 能 。 下 面 我 们 先 观察 一 下 行 记录 的 存储 结构 。 


其 中 : H 表 示 记录 头 ;) | 表示 字段 长 度 ; D 表 示 字 段 内 容 。 


从 上 面 的 结构 可 见 ， 数 据 库 不 知道 一 条 记录 中 每 个 字段 的 偏 移 量 。 如 果 需 要 定位 字段 2， 必 须 从 字段 1 开始 ， 接 着 根据 字段 1 的 长 度 来 定位 字段 2。 


尾 的 字段 。 因 此 ， 在 做 表 设计 时 ， 将 访问 频繁 的 字段 放 在 前 面 。 


2. 字 段 类 型 


如 果 说 字段 存储 顺序 对 访问 性 能 有 一 定 影响 的 话 ， 那 么 字段 类 型 对 访问 性 能 就 有 着 更 显著 的 影响 。 常 见 的 问题 是 : @ 隐 式 数 


下 面 通过 两 个 示例 分 别 说 明 。 先 举 一 个 隐 式 数据 类 型 转化 的 示例 。 


此 靠近 记录 开始 地 方 的 字段 定位 速度 明显 快 于 记录 末 


居 类 型 转化 ; @ 和 错误 数据 类 型 带 来 的 成 本 估算 异常 。 


SQL> create table tl (owner varchar2 (30) , object name varchar2 (128) , object id varchar2 (100) ) ; 


// 表 已 创建 

SQL> insert into tl1 (owner, object name, object id) 
SQL> commit; °- 

/ /提交 完 成 

SQL> create index idx tl id on tl (object id) ; 

// 索 引 已 创建 

SQL> set autotrace on 

SQL> select * from tl where object id=20; 


select owner, object name, object id from dba_object 已 创建 18869 行 。 


| 0 | SELECT STATEMENT | | 
1 | TABLE ACCESS FULL| T1 | 


Predicate Information (identified by operation id) : 


1 - filter (TO NUMBER ("OBJECT ID") =20) 


/ 
// 下 面 我 们 看 看 正常 情况 下 的 执行 计划 
SQL> select * from tl where object id='20'; 


| Id | Operation | Name | Rows | Byt 
| 0 | SELECT STATEMENT | | 11 LE 
| 1 | TABLE ACCESS BY INDEX ROWID 

【到 | | 
[| INDEX RANGE SCAN | IDX T1 ID | 78 | 


Predicate Information (identified by operation id) 


2 - access ("OBJECT ID" 
// 从 上 面 可 见 ， 引 用 了 正确 莘 数 据 类 型 后 ， 走 了 索引 的 范围 扫描 


| Name | Rows | Bytes | Cost (%CPU) | Time | 


es | Cost (%CPU) | Time | 
35: 1 16 (0) | 00: 00: 01 | 
35 1 16 tO) | O00 O00: OT 1 


| 1 (0) | 00: 00: 01 | 


下 面 看 一 下 因为 数据 类 型 异常 导致 的 优化 器 估算 异常 的 示例 。 


SQL> create table t test (id number, v1 varchar2 (20) 
// 表 已 创建 


SQL> insert into 七 test select rownum, 


，n1l number, dl date) ; 


名 to_char (to gdate ('2001-01-01', 'yyyy-mm-dd') + (rownum-1) , 'yyyy-mm-dd') ， 
3 to char (to date ('2001-01-01', 'yyyy-mm-dd') + (rownum-1) , 'yyyymmdd') ， 
4 to gdate ('2001-01-01', 'yyyy-mm-dd') + (rownum-1) from dual 


5 connect by rownum<= (to date ('2010-12-31', 'yyyy-mm-dd') - to date ('2001-01-01', 'yyyy-mm-dd') ) ; 


// 已 创建 3651 行 


SQL> exec dbms_ stats.gather table stats ('hf', 't test'); 


//PL/SQL 过 程 已 成 功 完 成 


SQL> alter session set nls date format="'yyyy-mm-dd hh24: mi: ss'; 
/ /会 话 已 更 改 
SQL> select * from t test where rownum<10; 


685 20021116 

686 20021117 

687 20021118 

688 20021119 

689 20021120 

690 20021121 

691 20021122 

692 20021123 

693 20021124 
// 已 选择 9 行 
// 上 面 创建 了 一 张 测试 表 ， 包 含 3 个 字段 ， 保 存 的 信息 都 是 “日 期 ” 
SQL> select * from t test 


N1 D1 


20021116 2002-11-16 : 
20021117 2002-11-17 00: 00: 00 
20021118 2002-11-18 00: 00: 00 
20021119 2002-11-19 00: 00: 00 
20021120 2002-11-20 00: 00: 00 
20021121 2002-11-21 00: 00: 00 
20021122 2002-11-22 00: 00: 00 
20021123 2002-11-23 00: 00: 00 
20021124 2002-11-24 00: 00: 00 


。 后面 插 入 了 10 年 的 日 期 数据 


where dl between to date ('2001-01-01', 'yyyy-mm-dd') and to date ('2002-01-01', 'yyyy-mm-dd') ; 


Cost (%CPU) | Time | 


(0) | 00: 00: O01 1 


| Id | Operation | Name | Rows | Bytes | 
| 0 | SELECT STATEMENT | 1 366 | 10614 | 
I* 1 | TABLE ACCESS FULL| T_TEST | 366 | 10614 | 


Predicate Information (identified by operation id) 


7 (0) | 00: 00: 01 | 


) DATE (' 2002-01-01 00: 00: 00', 'syyyy-mm-dd 
ss') AND "D1">=TO DATE (' 2001-01-01 00: 00: 00', 'syyyy-mm-dd 


// 上 面 测试 中 按 日 期 类 型 字段 进行 范围 扫描 ， 优 化 器 评估 返回 366 条 记录 ， 这 是 十 分 精准 的 


SQL> select * from 七 test where v1 between '20010101' and '20020101 


| Rows | Bytes | 


| SELECT STATEMENT | [ 
| TABLE ACCESS FULL| T_TEST | 


402 | 10854 | 
402 | 10854 | 


Cost (%CPU) 


人 (0) | 00: 00: 01 | 
(0) | 00: 00: 01 1 


Predicate Information (identified by operation id) 


1 - filter ("V1i"<='20020101' AND "V1">='20010101' 


) 


/* 如 果 使 用 文本 字段 进行 类 似 的 查询 ， 优 化 器 评估 返回 402 条 记录 ， 这 较 上 面 存在 一 定 偏差 。 为 什么 会 造成 这 一 现象 ? 原因 就 是 优化 器 针对 文本 的 范围 选择 率 的 评估 不 如 日 期 类 型 精准 


A 
SQL> select * from t test where nl between 20010101 


| Id | Operation | Name | Rows | Bytes | 
| 0 | SELECT STATEMENT | | 402 | 10854 | 
I* 1 | TABLE ACCESS FULL| T_TEST | 402 | 10854 | 


Predicate Information (identified by operation id) : 


1 - filter ("N1 


20020101 AND "N1">=20010101) 
/ /数字 类 型 与 文本 类 型 类 似 


and 20020101; 


Cost (%CPU) | Time | 


2 (0) | 00: 00: 01 | 
学 (0) | 00: 00: 01 1 


7.3 索引 


索引 可 以 说 是 Oracle 数 据 库 中 除了 表 以 外 最 重要 的 对 象 了 。 通 过 添加 索引 来 提高 查询 性 能 ， 也 是 最 为 常见 的 一 种 优化 手段 。 甚 至 很 多 非 DBA 人 员 认 为 ， 数 折 


也 说 明了 索引 对 于 优化 的 重要 意义 。 


Oracle 支 持 多 种 索引 。 下 面 针 对 几 种 常用 的 索引 分 别 加 以 介绍 。 


1.B 树 索引 


B 树 索引 是 Oracle 数 据 库 的 默认 索引 ， 也 是 最 为 常见 的 一 种 索引 。 通 常 我 们 所 说 的 索引 都 是 特 指 B 树 索引 ( 见 图 7-1) 。 
Root 


那 为 什么 使 用 B 树 索引 可 以 调 高 访问 速 


局 库 优化 就 是 加 索引 。 这 虽然 说 有 些 偏颇 ， 但 


度 呢 ， 这 就 要 从 索引 结构 来 说 明了 。 


ADK ROWID 


AAA ROWID AKA ROWID 
ABC ROWID 


ACF ROWID 


| 
' Branch 
LO6 > a 
BAC ROWID BII ROWID BOO ROWID 
BJL ROWID BRZ ROWID «<---> leaf 


APP ROWID |<—>| BDF ROWID 


BGG ROWID 


BMW ROWID BYY ROWID 
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-1 B 树 索引 


整个 索引 结构 就 是 一 个 平衡 树 (Balance Tree) ， 这 也 就 是 称 为 B 树 索引 的 原因 。 在 整个 树 形 结构 中 ， 包 含有 3 种 节点 ， 


的 索引 只 有 根 节点 和 叶子 节点 。 在 根 节 点 或 分 支 节 点 中 ， 存 在 一 组 键 值 范 围 ， 当 根据 条 件 访问 到 这 个 节 
首先 查询 根 节点 ， 在 这 个 节点 中 有 一 组 键 值 BC， 它 代表 将 键 值 范围 分 为 三 个 区 间 ， 分 别 是 X<B、B<X<C、C<X。 


节点 时 ， 根 据 范围 


分 别 是 根 节点 (Root) 、 分 支 节点 (Branch) 、 


叶子 节点 (Leaf) 。 有 的 简单 


路 由 到 不同 的 分 支 节点 或 叶子 节点 。 例 如 上 面 示例 中 ， 如 果 输 入 的 条 件 是 'AA'， 那 么 
为 输入 的 条 件 是 'AA'， 故 属于 第 一 个 区 间 ， 相 关 数 据 会 在 对 应 的 第 一 个 分 支 节点 上 。 在 


第 一 个 分 支 节点 (L1-1) 应 用 同样 的 方法 ， 可 知 数据 在 第 一 个 叶子 节点 (L0-1) 。 对 于 叶子 节点 来 说 ， 保 存 的 一 组 记录 ， 每 条 记录 包含 两 部 分 信息 : 一 是 索引 键 值 ， 二 是 对 应 的 行 地 址 (ROWID) 。 通 过 行 


地 址 ， 就 可 以 很 快 定位 到 数据 块 中 的 记录 了 。 


下 面 通过 一 个 示例 说 明 为 什么 通过 索引 访问 会 很 快 。 


SQL> create table tl as select * from dba objects; 
// 表 已 创建 

SQL> insert into t1 select * from tl1; 

// 已 创建 18870 行 

SQL> / 

// 已 创建 37740 行 

SQL> 

// 已 创建 75480 行 

SQL> / 

// 已 创建 150960 行 

SQL> / 

// 已 创建 301920 行 

SQL> commit; 

// 提 交 完 成 

SQL> select * from tl where object id=20; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT | | 89 | 18423 | 2194 (ly | 00; 0; 27 | 
I* 1 | TABLE ACCESS FULL| T1 | 89 | 18423 | 2194 Ct} | O00Q: 7 | 
Rt er et Gt rn 统计 信息 
0 recursive calls 

0 db block gets 

11251 consistent gets 

0 physical reads 

SQL> create index idx object id on tl (object id) ; 

// 索 引 已 创建 

SQL> select * from tl where object id=20; 

| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time 


| 0 | SELECT STATEMENT 
1 | 89 | 18423 | 2188 (1) | 00: 00: 27 
| 1 | TABLE ACCESS BY INDEX ROWID 


| T1 | 89 | 18423 | 2188 (1) | 00: 00: 27 
[| INDEX RANGE SCAN 
| IDX_ OBJECT ID | 2580 | l 3 《0 1 O07 002 0 


一 统计 信息 


0 recursive calls 
0 db block gets 
38 consistent gets 
0 physical reads 


/* 从 前 后 执行 对 比 来 看 ， 前 者 走 了 全 表 扫 描 ， 后 者 走 了 索引 扫描 。 直 观 地 对 比 统计 信息 的 “consistent gets” 一 栏 ， 


前 者 需要 1 万 多 次 一 致 性 读 ， 后 者 只 要 数 十 次 一 致 性 读 ， 两 者 差异 巨大 。 自 然 ， 执 行 时 间 也 差异 巨大 


与 B 树 索引 完全 不 同 。 在 Oracle 的 优化 器 中 ， 


2. 位 图 索引 
位 图 索引 是 另外 一 种 较为 常见 的 索引 ， 虽 然 阅 是 较为 常见 ， 但 也 仅 限 于 个 别 场景 ， 其 主要 适用 在 分 析 型 数据 库 中 。 其 原理 
转换 。 这 个 在 后 面 的 章节 会 有 详细 说 明 。 
下 面 首 先 来 看 看 位 图 索引 的 结构 ， 示 例如 表 7-1 所 示 。 
表 7-1 位 图 索引 结构 


个 别 场景 下 可 以 将 两 类 索引 相互 


KEY START_ROWID END_ROWID BITMAP 
blue 10.0.0.3 12.8.3 1000… 
green 10.0.0.3 12.83 0100…: 
red 10.0.0.3 12.8.3 0010… 
yellow 10.0.0.3 12.8.3 0001… 


在 上 面 的 显示 中 ，10.0.3= > 文件 号 + 块 号 + 行 号 。 从 表 7-1 所 示 可 见 ， 位 图 索引 是 通过 在 指定 的 地 址 范 
索引 的 不 同 值 很 少 的 话 ， 位 图 索引 是 很 省 空间 的 。 换 名 话说， 其 存储 密度 很 高 。 


内 ， 如 对 应 记录 是 某 个 键 值 的 话 ， 则 对 应 值 设置 为 1， 和 否则 设置 为 0。 从 上 面 结构 可 见 ， 如 果 位 


[ 


下 面 在 通过 一 个 示例 说 明 位 图 索引 的 用 法 。 


create table tl as select * from dba objects where rownum<=50000; 
// 表 已 创建 

update tl1 set status='NOVALID' where object igd=20; 

// 更 新 3 条 

update tl set status=NULL where object iqd=21; 

// 更 新 1 条 

commit; 

// 提 交 完 成 

alter table tl add constraint pk tl primary key (object id) ; 
// 索 引 已 创建 

Create bitmap index idx status on tl (status) ; 

// 索 引 已 创建 


select count (*) from t1; 


| 0 | SELECT STATEMENT | [ | 2 
| 1 | SORT AGGREGATE | | 11 
| 2 | BITMAP CONVERSION COUNT | | 50000 | 2 
| 3 | BITMAP INDEX FAST FULL SCAN 
| IDX_STATUS | | | | 
Statistics 


5 consistent 


gets 
人 并 从 的 用 信用 中 并 且 走 的 是 位 图 索引 快速 全 扫描 。 即 使 位 图 索引 字段 有 空 值 ， 由 于 位 图 索引 保存 空 值 ， 因 此 也 没有 问题 。 此 外 ， 这 也 要 看 位 图 索引 字段 值 的 基数 ， 如 果 基 数 较 低 ， 则 该 位 图 索引 较 小 ; 如 果 基 教 很 大 ， 则 位 图 ; 


select /*+ index (tl pk t1) */ count (*) from tl; 


0 | SELECT STATEMENT | 
| 1 | SORT AGGREGATE | | 
-| INDEX FULL SCAN| PK T1 | 5000 


1 | 
1 | | | 
0 1 


105 consistent gets 


// 强 制 使 用 主键 索引 (B 树 索引 ) ， 可 看 到 一 致 性 读 大 大 增加 。 这 也 间接 说 明了 位 图 索引 的 高 密度 存储 特点 


3. 其 他 索引 


上 面 我 们 谈 到 了 最 为 常见 的 两 种 索引 类 型 ， 下 面 再 看 看 其 他 索引 类 型 。 从 本 质 上 来 讲 ， 它 们 还 是 B 树 或 者 位 图 索引 。 


(1) 函数 索引 


函数 索引 就 是 将 一 个 函数 计算 的 结果 存储 在 列 中 ， 而 不 是 存储 列 数据 本 身 。 可 以 把 基于 函数 的 索引 看 成 一 个 虚拟 列 上 的 索引 。 总 之 ， 所 谓 函 数 索引 也 只 不 过 是 基于 加 工 过 的 逻辑 列 所 创建 的 索引 而 已 。 


SQL> create table tl as select * from dba objects; 


// 表 已 创建 

SQL> create index idx object name on tl (object name) ; 

// 索 引 已 创建 

SQL> select * from tl where upper (object name) ='EMP'; 

| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT | | | 621 | 74 (oy) D0 O00 .01.1 
I* 1 | TABLE ACCESS FULL| Tl1 | ;| 621 | 74 (0) | 00: 00: 


01 1 


// 虽 然 在 object_name 字 段 上 建立 了 索引 ， 但 是 由 于 使 用 了 upPPer () 函数 ， 导 致 无 法 利用 该 索 
SQL> create index idx object name upper on tl (upper (object name) ) ; 


// 索 引 已 创建 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | 
| 0 | SELECT STATEMENT | | 179 | 48867 | 35 (0) 1 
| 1 | TABLE ACCESS BY INDEX ROWID 

1 179 | 48867 | 5 (0) | 
使 | INDEX RANGE SCAN | IDX OBJECT NAME UPPER | J | 1 (0) 


/ /创建 了 单独 的 函数 索引 ， 此 时 的 查询 就 可 以 利用 索引 了 


(2) 虚拟 列 索引 


这 里 要 先 谈 一 下 “虚拟 列 ”。 虚 拟 列 是 在 119 中 新 引入 的 一 个 技术 。 从 字面 就 可 以 理解 ， 创 建 的 列 不 真正 物理 保存 ， 而 只 是 一 个 定义 。 而 基于 这 个 列 创建 的 索引 ， 就 是 虚拟 列 索引 。 在 某 种 程度 上 ， 虚 
拟 列 索引 和 上 面谈 到 的 函数 索引 有 些 类 似 。 


(3) 虚拟 索引 


在 119 中 ，Oracle 可 以 通过 NOSEGMENT 子 句 命令 创建 一 个 永远 不 会 使 用 且 不 会 为 其 分 配 任何 盘 区 的 索引 。 如 果 想 要 创建 一 个 很 大 的 索引 ， 但 并 不 想 给 它 分 配 空间 ， 而 是 要 先 确定 优化 器 是 否 会 选择 使 
该 索引 ， 那 么 使 用 NOSEGMENT 来 创建 索引 就 可 以 先进 行 测试 。 如 果 确 定 了 这 个 索引 是 有 用 的 ， 可 以 删除 该 索引 ， 然 后 使 用 不 包含 NOSEGMENT 的 语句 重建 它 。 


(4) 不 可 见 索引 


不 可 见 索引 不 是 一 种 特殊 的 索引 类 型 ， 而 是 使 索引 对 优化 器 “不 可 见 ”， 这 样 就 没有 查询 会 使 用 它 了 。 这 对 于 评估 索引 使 用 效果 非常 有 帮助 。 特 别 是 对 某 些 第 三 方 应 用 ， 无 法 修改 代码 ， 这 个 特性 十 分 
有 用 。 下 面 通过 一 个 示例 说 明 。 


SQL> create table tl as Select * from dba objects; 
// 表 已 创建 


SQL> create index idx id on tl (object id) ; 
// 索 引 已 创建 
SQL> select * from tl where object id=20; 


Id Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
0 SELECT STATEMENT | | 31 621 | 3 | 
1 TABLE ACCESS BY INDEX ROWID 
] 2 | | 621 | | | 
夫 总 INDEX RANGE SCAN | IDX ID | | | 1 | 


SQL> alter index idx id invisible; 
// 索 引 已 更 改 
SQL> select * from tl where object id=20; 


Id Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
0 SELECT STATEMENT | | :| 621 | 74 oy 1 0s Os 0 | 
#1 TABLE ACCESS FULL| T1 | | 621 | 74 (0) | 00: 00: 01 | 


// 将 索引 设置 为 不 可 见 后 ， 优 化 器 将 不 考虑 这 个 索引 ， 因 此 选用 了 全 表 扫 描 方式 


(5) 压缩 索引 


Oracle 中 的 索引 键 允许 压缩 存储 索引 键 中 前 面 重复 的 部 分 ， 并 且 是 每 个 时 块 而 不 是 每 个 时 块 中 的 每 行 存储 重复 的 值 。 压 缩 和 非 压缩 索引 在 使 用 上 差别 不 大 ， 但 压缩 索引 能 节省 大 量 空间 。 利 用 压缩 索 
引 ， 块 缓冲 区 缓存 比 以 前 能 存放 更 多 的 索引 条 目 ， 缓 存 命中 率 可 能 会 上 升 ， 物 理 /O 应 该 下 降 ， 但 是 要 多 占用 一 些 CPU 时 间 来 处 理 索引 ， 还 会 增加 块 竞争 的 可 能 性 。 


下 面 通过 一 个 示例 说 明 。 


SQL> create table t as select * from all objects; 


// 表 已 创建 

SQL> create table idx stats as select ' ' what, a.* from index stats a where 1=0; 
// 表 已 创建 

SQL> create index t idx 0 on t (owner, object type, object name) ; 

// 案 引 已 创建 


SQL> analyze index t idx 0 validate structure; 

// 索 引 已 分 析 

SQL> insert into idx stats select 'compress 0', a.* from index stats a where a.name='T IDX 0'; 已 创建 1 行 
SQL> drop index t idx 0; 

// 索 引 已 删除 

SQL> create index t idx 1 on t (owner, object type, object name) compress 1; 

// 案 引 已 创建 

SQL> analyze index t idx 1 validate structure; 

// 索 引 已 分 析 

SQL> insert into idx stats select 'compress 1', a.* from index stats a where a.name='T IDX 1'; 
// 已 创建 1 行 

SQL> drop index t idx 1; 

// 索 引 已 删除 

SQL> create index t idx 2 on t (owner, object type, object name) compress 2; 

// 案 引 已 创建 

SQL> analyze index t idx 2 validate structure; 

// 索 引 已 分 析 


SQL> insert into idx stats Select 'compress 2', a.* from index stats a where a.name='T IDX 2'; 


// 已 创建 1 行 
SQL> select what，helight，1f blks, br blks, btree space, opt cmpr count, opt cmpr pctsave from idx stats; 
WHAT HEIGHT LF BLKS BR BLKS BTREE SPACE OPT CMPR COUNT OPT CMPR PCTSAVE 
compress 0 2 109 1 880032 2 29 
compress 1 2 94 L 759656 2 18 
compress 2 2 76 在 615728 2 0 
/* 从 输出 可 见 ， 对 于 不 压缩 、 压 缩 一 个 字段 (compress=1) 、 压 缩 两 个 字段 (compress=2) ， 对 应 索引 的 叶子 节点 明显 减少 
# 
/ 


(6) 复合 索引 


当 某 个 索引 包含 有 多 个 已 索引 的 列 时 ， 这 个 索引 就 称 为 复合 索引 。 如 果 查 询 条 件 中 包含 多 个 列 ， 往 往 可 以 应 用 到 复合 索引 。 下 面 通过 一 个 示例 说 明 。 


SQL> create table tl as select * from dba objects; 
// 表 已 创建 


SQL> create index idx 1 on tl (owner, object id) ; 
// 索 引 已 创建 


SQL> select * from tl where owner='SYS' and object_idq=20; 
| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT 1 | 2 414 | 2 | 
| 1 | TABLE ACCESS BY INDEX ROWID 

| T1 | :|| 414 | 2 | 
便 : :次 | INDEX RANGE SCAN | Thx 1 1 | | 1 | 


// 此 时 利用 了 复合 


(7) 反 转 索引 


反 转 索引 是 一 种 特殊 的 B 树 索引 。 它 将 索引 列 中 列 值 的 每 个 字 节 的 位 置 反 转 。 例 如 “12345” ， 反 转 之 后 是 “54321”。 其 最 大 特点 就 是 对 于 原来 相连 比较 紧密 的 值 ， 强 制 使 其 分 散 到 相距 比较 远 的 位 置 
上 。 这 样 可 以 使 数据 更 均匀 地 分 布 。 但 由 于 反 转 索引 的 特点 ， 导 致 只 有 精准 匹配 查找 才能 使 用 反 转 索引 。 下 面 通 过 一 个 示例 说 明 。 


create table tl as Select rownum id from dba objects; 
create index tl idqx on tl (id) ; 
alter index idx_ tl idx rebuild reverse; 


7.4 视图 


[网 


四 | 
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视图 也 是 很 常见 的 一 种 对 象 。 这 里 首先 要 明确 一 点 ， 视 图 其 实 就 是 一 条 查询 SQL 语句 ， 用 于 显示 一 个 或 多 个 表 或 
作 是 存储 的 查询 或 一 个 虚拟 表 。 


他 视 可 以 被 看 


中 的 相关 数据 。 视 图 将 一 个 查询 的 结果 作为 一 个 表 来 使 用 ， 因 此 视 


四 
四 


常见 的 视图 有 两 种 形式 : 一 种 是 以 CREATE VIEW 语 法 显 式 创建 的 视 | 


;另外 一 种 是 数据 库 自动 生成 的 视 


。 显 式 的 较 好 理解 ， 下 面 举 个 后 者 的 示例 。 


SQL> create table tl as select * from dba objects; 
SQL> select * from (select owner, object id from tl order by object id) where rownum<5; 


| Id | Operation | Name | Rows | Bytes |TempSpc| Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT| | 4 1 120 | | 164 (2 Vor G0 O02 1] 
I* 1 | COUNT STOPKEY | | | | | | | 
| | VIEW | | 18910 | 554K| 1 164 27 1 00+ O07 O02 1 
| 3 ] SORT ORDER BY STOPKEY 

| 18910 | 221KI 384K| 164 (2) 1 O00: O00 02 1 
| 4 1 TABLE ACCESS FULL 


| T1 | 18910 | 221KI | 74 (0) | 00: 00: 01 | 


/* 这 里 我 们 可 以 看 到 ， 在 ID=2 的 一 行 ，Operation 对 应 的 是 “VIEW” 
x 
’ 


样 。 数 据 库 在 处 理 上 面 SQL 语句 的 子 查询 时 ， 会 生成 一 种 称 为 内 联 视图 (inline view) 的 对 象 


中 | 


当 一 个 SQL 语句 包含 视 


时 ，Oracle 会 使 用 一 种 优化 技术 一 一 视图 推 入 。 其 做 法 是 将 查询 的 限制 条 件 推 入 视图 内 层 ， 这 样 有 利于 将 第 一 步 的 结果 集 限 制 到 最 小 ， 是 CBO 的 优化 技术 之 一 。 


SQL>create table tl as select * from dba objects; 

// 表 已 创建 

SQL> create View v tl as select * from tl where owner='SYS'; 
// 视 图 已 创建 

SQL> select * from v tl V where v.object id=20; 


| Id | Operation | Name | Rows Bytes | Cost (%CPU) | Ti 
| 0 | SELECT STATEMENT | | 1 90 | (0) | 00 
| 1 | TABLE ACCESS BY INDEX ROWID| T1 | 1 90 | 人 (0) | 00 
[| INDEX RANGE SCAN | IDX 1 | | 和 (0) | 00 


A 
SQL> create view v2 as select owner, count (*) cnt from t1 group by owner; 
// 视 图 已 创建 

SQL> select * from v2 where cnt>10; 


| Name | Rows | Bytes | 
SELECT STATEMENT | | 41. 7 75 (2) | 00: 00: 01 | 
FILTER 1 | | 1 | 
HASH GROUP BY | | | 7 75 02) | OO: O00E 1 
TABLE ACCESS FULL | T1 | 18910 | 129K 74 


1 - filter (COUNT (*) >10) 
/* 从 上 述 执行 计划 可 见 ， 仅 ID=2、3 的 步骤 就 完成 了 视图 的 执行 过 程 ，ID=1 是 指定 的 外 部 过 滤 条 件 。 这 一 条 件 没有 推 入 视图 的 定义 中 。 这 里 的 原因 主要 是 在 视图 定义 中 引用 了 GROUP BY 分 组 语句 。 在 很 多 种 情况 下 ， 都 会 出 现 条 件 天 
要 


扫描 ， 然 后 回 表 查 ， 最 终 返 回 结果 。 在 对 应 TD=2 的 步骤 ， 我 们 可 以 发 现 包含 了 两 个 过 滤 条 件 ， 一 个 是 视图 定义 的 条 件 ， 一 个 是 查询 语句 中 对 视图 的 限制 条 件 ， 这 


Oracle 中 的 函数 和 过 程 最 本 质 的 差别 应 该 是 调用 方式 上 的 差别 ， 函 数 是 可 以 在 SQL 中 直接 调用 的 。 在 某 些 场合 下 ， 在 SQL 语句 中 使 用 函数 可 以 简化 一 个 处 理 逻 辑 ， 从 而 提高 整体 效率 。 下 面 我 们 通过 一 


个 示例 说 明 。 


SQL> create table t ( idnumber, name varchar2 (10) , title varchar2 (10) ) ; 
// 表 已 创建 

SQL> insert into values 
SQL> insert into values 


t ( 'userl', 'VP') ; 

在 lh 
SQL> insert into t values ( 

老 

世 ( 


1, 
2, 'user2', 'CEO') ; 
SSG WP 
SQL> insert into values 4， 
SQL> insert into values es 
SQL> commit; 
// 提 交 完 成 
SQL> select * from 七 ; 
ID NAME TITLE 


'user4', 'user') ; 
'user5', 'user') ; 


1 userl VP 
2 user2 CEO 
3 user3 VP 
4 user4 user 
5 user5 user 


全 四 八重 村 全 全 0 (及 以 上 人 员 ) 和 普通 人 员 的 人 数 。 由 于 上 面 的 人 员 职务 TITLE， 没 有 直接 层次 关系 (虽然 我 们 知道 VP 和 CEO 是 属于 VP 及 以 上 人 员 ) 。 但 通过 使 用 一 个 DECODE (系统 内 置 ) 函数 ， 可 以 包含 业务 逻辑 ， 完 成 这 


SQL> select decode (title, 'VP', 'CEO VP', 'CEO', 'CEO VP', 'USER') title，count (1) title cnt 
2 fromt 
3 group by decode (title, 'VP'!, 'CEO VP', 'CEO', 'CEO VP', 'USER') ; 


TITLE TITLE_CNT 
CEO_VP 3 
USER 2 


7.6 数据 链 (DB_LINK) 


DATABASE LINK 是 Oracle 提 供 的 一 种 功能 ， 可 以 很 方便 地 访问 远程 数据 。 但 对 于 SQL 语句 来 说 ， 非 常 不 建议 在 语句 中 引用 远程 对 象 。 原 因 是 ， 对 于 一 个 远程 对 象 来 说 ， 优 化 器 能 做 的 工作 有 限 ， 很 难保 


证 制定 出 高 效 的 执行 计划 来 。 下 面 通过 示例 说 明 。 


SQL> conn testuser/testpwd 

// 已 连接 

SQL> create table t obj as select * from dba objects; 
// 表 已 创建 

SQL> create index idx owner on t obj (owner) ; 

// 索 引 已 创建 

SQL> create public database link lnk test connect to testuser jdentified by testpwd using '127.0.0.1: 1521/xe'; 
/ /数据 库 链 接 已 创建 

SQL> conn hf/123 

// 已 连接 

SQL> select count (*) from t obj@lnk test; 

COUNT (*) 

18880 

SQL> create index idx username on t user (username) ; 
// 索 引 已 创建 

SQL> create index idx owner on t obj (owner) ; 


// 索 引 已 创建 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT | | | 45 | 5 (0) | 00: 00: 01 
| 1 1 NESTED LOOPS 1 | | | 1 
| 2 | NESTED LOOPS | | | 45 | 75 (0) | 00: 00: 01 
| | TABLE ACCESS FULL 

| T_OBJ | | 33 | 74 (0) | 00: 00: 01 
I* 4 1 INDEX RANGE SCAN 

| IDxX USERNAME | | | 0 (0) | 00: 00: 01 
| 5 | TABLE ACCESS BY INDEX ROWID 

| T_USER | 4 | 12 | 1 (0) | 00: 00: 01 


INVALID') 
4 ~- access ("U", ="O" . "OWNER") 
SQL> select u.user id, u.username, o.0object name from t useru, t obj@lnk test o where u.username=0.ow 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 


| 0 | SELECT STATEMENT | | pa | 100 | 46 (0) | 00: 00: 01 
| 1 | NESTED LOOPS | | | | | 
| | NESTED LOOPS | | 王 100 | 46 (0) | 00: 00: 01 
| 3 1 REMOTE | T_OBJ | 主 浊 88 | 45 (0) | 00: 00: 01 
|* 4 1 INDEX RANGE SCAN 

| IDX_USERNAMP | 和 | 0 《oh | OO OO: OL 
| | TABLE ACCESS BY INDEX RONID 

| T_USER | | 12 | 工 (0) | 00: 00: 01 


3 -~ SELECT "OWNER", "OBJECT NAME", "STATUS" FROM "T OBJ" "O" WHERE "STATUS"= 'INVALID' (accessing 'LNK TEST" 
Ma 条 SQL 可 见 ， 对 于 本 地 SQL 与 远程 SQL 来 说 ， 优 化 器 的 处 理 策 略 是 不 同 的 。 对 于 远程 对 象 ， 本 地 的 优化 器 往往 不 能 很 准确 地 了 和 解 对 象 ， 从 而 定 有 效 的 执行 计划 
四 


第 8 章 ”SQL 优化 相关 存储 结构 


在 对 SQL 的 优化 过 程 中 ， 了 解 对 象 存储 结构 也 很 重要 。 在 Oracle 数 据 库 中 ， 存 储 结构 分 为 四 级 管理 : 表 空 间 (tablespace) 、 段 (Segment) 、 区 (extent) 、 块 (block) 。 表 空间 是 由 段 
(segment) 组 成 的 ， 段 是 由 范围 (extent) 组 成 的 ， 范 围 是 由 连续 的 块 (block) 组 成 的 。 当 在 表 空 间 里 创建 一 个 table、index 等 对 象 时 ， 其 实 对 使 用 者 而 言 其 即 为 对 象 ， 但 是 从 Oracle 存 储 的 角度 来 说 
把 它 称 为 sgment。Oracle 最 小 的 读 写 单位 是 block， 但 是 在 为 对 象 分 配 空间 时 单位 却 是 extent， 这 样 做 的 好 处 其 实 就 是 为 了 提高 效率 。 上 面 提 到 ， 段 是 由 范围 组 成 的 ， 当 一 个 extent 被 分 配给 一 个 
segment 时 ， 和 segment 对 应 的 对 象 就 可 以 使 用 空间 了 。 


下 面 针 对 每 一 级 管理 单位 ， 分 别 说 明 一 下 。 


8.1 表 空 间 


表 空 间 是 数据 库 的 一 种 逻辑 结构 ， 它 在 物理 上 对 应 着 一 个 或 多 个 数据 文件 。 平 常 所 讲 的 表 空 间 管理 实际 上 指 的 是 对 表 空 间 所 对 应 的 数据 文件 的 空间 管理 。Oracle 支 持 两 种 管理 方式 ， 一 种 是 字典 管理 
(简称 DMT) ， 一 种 是 本 地 管理 (简称 LMT) 。 这 里 所 说 的 管理 方式 是 指针 对 extent 的 管理 方式 。extent 也 是 数据 库 的 一 种 逻辑 结构 ， 它 包含 一 定数 量 的 、 连 续 的 Oracle 块 。 它 是 Oracle 的 空间 分 配 的 最 小 
单位 。 针 对 它 的 管理 方式 就 是 指 表 空 间 中 的 extent 是 如 何 被 管理 的 (记录 extent 的 free、used 使 用 情况 ) 。 


在 这 两 种 管理 方式 中 ， 字 典 管理 方式 是 Oracle 遗 留 的 一 种 空间 管理 方式 ， 它 采用 数据 字典 表 UET$、FET$ 来 记录 表 空间 中 extent 的 使 用 情况 。 每 次 进行 涉及 空间 管理 的 操作 时 ， 都 必须 对 这 两 个 表 进行 
维护 ， 其 影响 是 显而易见 的 。 当 并 发 提高 时 ， 该 表 上 的 争 用 将 无 法 避免 被 提高 ， 同 时 将 产生 大 量 的 undo 占 用 大 量 系统 回 滚 段 ， 而 且 在 字典 管理 方式 下 将 产生 令 人 头痛 的 碎片 问题 。 本 地 管理 方式 是 从 Oracle 
8i 开 始 支持 的 一 种 管理 方式 ， 也 是 目前 Oracle 强 烈 建议 采用 的 一 种 方式 。 它 不 再 利用 数据 字典 表 来 记录 空间 使 用 情况 ， 取 而 代 之 的 是 在 数据 文件 头 部 增加 一 个 位 图 区 ， 用 位 图 来 记录 空间 的 使 用 情况 ， 每 一 
个 bit 都 代表 着 一 个 extent 的 使 用 情况 。 数 据 库 中 如 果 不 存在 dmt 类 型 的 表 空 间 ， 则 UET$ 和 FET$ 中 不 再 有 信息 。 


[ 


表 空 间 本 身 是 和 SQL 语 句 运行 效率 相关 的 ， 主 要 包括 以 下 几 个 方面 : 


“ 对 于 DML 语 句 来 说 ， 如 果 涉 及 空间 的 扩展 ， 需 要 有 个 分 配 的 过 程 。 此 时 ， 给 用 户 的 体验 就 是 SQL 执 行 速度 很 慢 。 从 Oracle 10g 开 始 ， 引 入 了 一 个 等 待 事件 “data file init wtite” 来 表示 表 空 间 扩展 时 发 生 
的 等 待 。 为 Oracle 需 要 将 系统 块 格式 化 为 Oracle 数 据 块 ， 然 后 才能 提供 数据 库 使 用 。 常 见 的 优化 策略 是 在 大 规模 的 DML 操 作 之 前 提前 预 分 配 空间 的 ， 这 样 可 避免 临时 的 空间 扩展 导致 的 效率 低下 。 


“ 对 于 排序 等 操作 ， 如 果 空 间 消耗 较 大 ， 需 要 用 到 TEMP 表 空 间 。 如 果 TEMP 空 间 不 足 ， 会 导致 SQL 语句 执行 失败 。 因 此 ， 对 于 TEMP 表 空 间 的 使 用 要 进行 监控 ， 对 于 耗费 TEMP 较 大 的 SQL 需要 重点 关 
注 ， 并 进行 重点 优化 。 


8.2 段 


数据 段 ( 即 基 表 段 ) ， 是 Oracle 数 据 库 中 用 于 存储 基 表 数据 的 段 。 数 据 段 存储 在 表 空 间 中 ， 对 应 于 一 个 或 多 个 数据 文件 ( 段 可 以 来 自 多 个 文件 ， 但 段 中 指定 的 一 个 区 只 能 来 自 一 个 文件 ) 。 每 个 基 表 段 
都 有 一 个 数据 段 (cluster 聚 簇 段 中 ， 两 个 基 表 对 应 一 个 数据 段 ) 。 每 当 用 户 创建 一 个 基 表 时 ， 系 统 会 在 用 户 默认 的 表 空间 中 创建 一 个 数据 段 。 


根据 段 保存 对 象 的 不 同 ， 可 把 段 划分 为 多 种 类 型 ， 主 要 包括 以 下 几 种 : 


“ 表 段 : 最 普通 的 一 种 方式 。 一 张 表 即 对 应 一 个 段 ， 存 储 数 据 没有 顺序 。 表 中 所 有 数据 都 在 一 个 表 空 间 中 ( 段 是 不 可 以 跨 表 空间 的 ， 但 是 可 以 跨 文 件 ) 。 
“索引 段 : 保存 索引 数据 的 段 。 


“ 聚 簇 段 (CLUSTER) : 在 这 种 段 中 保存 多 张 表 的 数据 。 这 种 情况 主要 是 用 在 多 张 表 中 有 相同 的 表 数 据 列 或 多 张 表 经 常 一 起 使 用 的 情况 ， 但 更 新 开销 大 。 有 两 种 类 型 的 聚 答 


也 树 聚 共和 散 列 聚 徐 。 


: 索引 组 织 表 段 (IOT) : 段 中 数据 按照 索引 的 顺序 存储 数据 。 它 是 一 种 有 序 存 储 表 。 


: 表 分 区 段 或 子 分 区 段 : 一 张 表 中 的 数据 被 划分 为 多 个 分 区 ， 每 个 分 区 对 应 一 个 段 。 


: 索引 分 区 段 : 一 个 索引 中 的 数据 被 划分 为 多 个 分 区 ， 每 个 分 区 对 应 一 个 段 。 
: 大 对 象 段 (LOB) : 表 中 含有 大 对 象 数据 。 如 果 对 象 大 小 大 于 指定 的 范围 ， 则 会 将 对 象 数据 单独 保存 在 一 个 段 中 。 表 中 只 留 下 指向 该 段 的 地 址 指针 。 
: 其 他 : 除 以 上 类 型 之 外 ， 还 包括 回 退 段 、 临 时 段 、 嵌 套 表 段 (NESTED) 、 启 动 段 (BOOTSTRAP) 等 。 


从 10gR2 版 本 开始 ，Oracle 引 入 了 一 个 段 顾问 的 作业 。 这 个 作业 是 完成 对 段 的 一 些 分 析 工 作 ， 评 估 出 哪些 段 适合 进行 压缩 、 哪 些 段 存在 行 链接 等 。 后面 会 谈 到 “ 行 链接 ”， 这 里 重点 说 一 下 压缩 问题 。 
Oracle 的 数据 段 压 缩 技术 其 实 是 针对 块 级 别 的 数据 压缩 。 其 原理 是 将 块 中 的 重复 数据 通过 一 个 符号 来 表示 ， 即 块 中 相同 的 行 只 存储 一 条 ， 从 而 节约 了 空间 。 此 外 ， 这 种 技术 还 可 以 使 高 水 位 线 下 移 ， 使 未 使 
的 空间 被 表 空 间 的 其 他 段 使 用 。 这 种 技术 不 仅 可 用 于 表 ， 也 可 用 于 索引 。 凡 是 需要 对 表 、 索 引 扫描 数据 段 的 操作 都 可 以 从 段 压缩 中 受益 。 


8.3 区 


区 。 区 存储 于 段 中 ， 是 数据 库存 储 空间 逻辑 单位 ， 是 由 连续 的 数据 块 组 成 的 。 一 个 或 多 个 数据 块 组 成 一 个 区 ， 一 个 或 多 个 区 组 成 一 


区 是 磁盘 空间 分 配 的 最 小 单位 ， 磁 盘 按 区 划分 的 ， 每 次 至 少 分 配 一 个 区 。 


个 段 。 当 一 个 段 中 所 有 空间 用 完 时 ， 系 统 会 自动 给 该 段 分 配 一 个 新 区 。 段 的 增 大 是 通过 增加 取得 个 数 实现 的 。 


区 的 分 配方 式 有 两 种 ， 一 种 是 基于 字典 的 ， 一 种 是 本 地 化 管理 的 ， 这 在 8.1 节 已 经 有 介绍 。 此 外 ， 对 于 区 而 言 ， 还 有 一 些 存储 控制 参数 ， 它 决定 了 段 在 扩大 时 增加 区 的 方法 ， 包 括 initial、next、 


minextents、maxextents、pctincrase、optimal。 这 些 参数 联合 作 


在 区 中 ， 涉 及 效率 相关 的 主要 是 碎片 问题 。 碎 片 是 由 于 错误 或 表 空间 


， 可 决定 一 个 段 的 大 小 。 


中 的 实体 无 计划 删除 造成 的 。 我 们 可 以 通过 下 面 SQL 语句 查看 碎片 程度 。 


select tablespace name, sqrt (max (blocks) /sum (blocks) ) * (100/sqrt (sqrt (count (blocks) ) ) ) fsfi 


fromdba free space 

group by tablespace name 

order by 1; 

/* 其 中 fsfi 的 最 大 值 为 100， 是 理想 的 单 文件 表 空间 。 随 着 区 的 增加 ，fsfi 值 
i 


缓慢 下 降 ， 而 随 着 最 大 区 尺寸 的 减少 ，fsfi 的 值 迅 速 下 降 


Ts. 


网 


的 方法 查询 空闲 空间 ， 相 


yl 


本 地 化 管理 表 空 间 中 ， 所 有 的 区 使 用 统一 储存 参数 或 系统 自动 管理 的 存储 参数 。 本 地 化 管理 表 空 间 不 使 用 数据 字典 去 寻找 空闲 空间 ， 而 是 使 用 维护 位 图 的 方法 。 系 统 使 


邻 的 空闲 区 被 视 为 一 个 大 的 空闲 块 ， 从 设计 上 保证 自动 合并 碎片 。 此 外 ， 
及 产生 磁盘 碎片 。 如 果 碎 片 过 多 ， 可 以 使 用 “alter table xxx coalesce” 


8.4 块 


对 于 本 地 管理 表 空 间 ， 区 的 大 小 可 以 设置 为 相同 。 这 样 在 表 空 间 中 强制 设置 了 存储 参数 ，DBA 不 用 担心 用 户 使 用 不 正确 的 存储 参数 
命令 合并 碎片 。 


块 是 Oracle 数 据 库 中 最 小 的 一 个 数据 组 织 单位 。 它 的 大 小 是 由 参数 db_block _size 确 定 。 它 的 取 值 和 os 有 关 ， 一 般 是 os 物理 块 的 整数 倍 ， 即 512K 的 倍数 。 块 大 小 在 创建 数据 库 之 前 确定 ， 数 据 库 创建 或 


安装 结束 后 不 得 修改 。 对 于 系统 表 空间 及 其 他 默认 表 空 间 使 用 参数 db_block_size 确 定 块 大 小 ， 而 对 于 


1. 块 结构 


块 结构 示意 如 图 8-1 所 示 。 


pettree 


他 非 默 认 表 空间 使 用 参数 blocksize 确 定 块 大 小 。 


Cache Layer 


Transaction Layer: Fixed 


lransaction Layer: Variable 
Table Directory 
Row Directory 


Free Space 


信息 
导 。 


图 8-1 
信息 、 磁 盘 上 块 地 址 信 


块 上 活动 和 过 时 事务 信 
。 如 果 设置 了 不 恰当 的 init ttans 和 max trans ， 可 能 会 导致 进行 大 批量 并 发 操作 出 现 


信息 、 


己 的 存储 参数 时 。 


8-1 中 所 示 块 的 各 个 组 成 部 分 及 含义 如 下 : 


- 块头 (Block Header) : 最 上 面 的 三 个 部 分 。 包 含 着 关于 块 类 型 ( 表 块 、 索 引 块 等 ) 的 
Transaction Layer: 决定 了 该 块 可 以 并 发 操作 的 事务 数 ， 其 大 小 由 init trans 存 储 参 数 确定 。 而 Variable 大 小 由 max ttans 确 定 


严重 的 ITL 等 待 ， 甚 至 引起 ITL 死 锁 。 


“ 表 目 录 (Table Directory) : 包含 着 此 块 中 存储 各 行 的 表 的 信息 (多 个 表 的 数据 可 能 保存 在 同一 个 块 中 ， 如 clustertable) 。 
“ PCTFREE (空闲 率 ) : 用 于 指定 向 块 中 插入 新 行 时 应 该 保留 的 空闲 空间 的 百分比 ， 该 保留 空间 用 于 修改 已 包含 在 该 块 中 的 行 的 情况 下 使 用 。 如 PCTFREE 二 20， 表 示 插 入 数据 只 能 占 到 数据 块 80% 的 空 


“ 行 目 录 (Row Directory) : 包含 在 块 中 发 现 的 描述 行 的 信息 。 以 上 部 分 (Cache Layer 十 Transaction Layer 十 Table Directory 十 Row Directory) 为 块 的 开销 (Block Overhead) ， 其 余部 分 为 可 用 存储 空间 。 
仅 当 这 些 新 数据 库 对 象 未 直接 指定 


2. 存 储 参 数 


这 里 所 说 的 存储 参数 


从 块 中 删除 一 些 行 ， 也 不 立即 将 该 块 置 为 自由 空间 列表 。 适 用 于 MSSM 和 ASSM。 
目的 是 控制 向 一 个 数据 块 再 插入 新 的 数据 行 。 当 通过 删除 或 更 新 行 而 使 数据 库 块 的 使 用 百分比 低 于 PCTUSED 限 定 值 时 ，Ortacle 又 允许 向 该 块 中 插入 新 的 数 
琐 定 。 


改变 default storage 设 置 值 对 表 空间 中 已 有 的 数据 库 对 象 没有 影响 ， 它 只 影响 新 数据 库 对 象 的 存储 参数 ， 
它 主 要 是 用 于 更 新 操作 ， 其 取 值 范围 为 1~99， 黑 认为 10。 假 设 该 参数 取 0， 则 表示 在 插入 时 将 完全 填 满 数据 块 。 在 插入 新 行 时 ， 并 达到 该 数据 块 的 PCTFREE 时 ， 则 将 该 块 置 为 脱离 自由 空间 列表 。 即 使 


间 。 


要 有 以 下 几 个 : 
据 行 。PCTUSED 主 要 用 于 插入 限制 ， 是 为 表 的 每 个 数据 块 保留 的 可 用 空间 的 最 小 百分比 。 取 值 为 1~99， 默 认为 40。 当 块 达到 PCTUSED 限 额 时 ， 块 被 移出 空闲 队列 。 仅 适用 于 MSSM。 段 中 每 个 块 的 首部 都 
间 定 一 个 数据 块 中 分 配 的 事务 模 的 初始 值 。 取 值 范围 1~255， 默 认为 1。 每 一 个 更 新 块 的 事务 都 需要 在 块 中 有 一 个 事务 入 口 。INITRANS 参 数 确定 为 事务 处 理 项 预 分 配 多 


有 一 个 事务 表 。 事 务 表 中 建立 一 些 条 目 来 描述 那些 事务 将 块 上 的 哪些 行 锁 定 。 事 务 表 的 初始 化 大 小 由 initrans 指 定 。 事 务 表 会 动态 扩展 ， 最 大 到 maxtrans。 所 分 配 的 每 个 事务 条 目 需要 占用 块 首部 中 23~24 字 节 


的 存储 空间 。 
.INITRANS (最 小 事务 数量 ) : 
目的 增加 ， 因 


旨 定 老 


“ PCTUSED (使 用 率 ) : 空间 使 用 率 限 定 值 ， 
少数 据 块头 部 的 空间 。 当 预计 有 许多 并 发 事务 处 理 要 涉及 某 个 块 时 ， 可 为 相关 的 事务 处 理 项 预 分 配 更 多 的 空间 ， 以 避免 动态 分 配 该 空间 的 开销 。INITTRANS 对 于 表 的 存储 区 参数 来 说 默认 为 2 (即便 把 它 设 
为 1 或 者 在 数据 字典 中 声明 为 1) 。 此 外 ， 在 执行 create table as select 时 ， 每 个 初始 创建 的 表 块 的 相关 事务 列表 (interested transaction list，ITL) 的 实际 槽 数目 是 3， 而 不 是 由 inittrans 指 定 的 2。 适 用 于 MSSM 和 
据 块 的 并 发 事务 最 大 数 。 取 值 范围 1~255， 默 认为 255。MAXTRANS 限 制 能 够 并 发 进入 一 个 数据 块 的 事务 数量 。 如 果 同 时 有 MAXTRANS 个 事务 在 使 用 一 个 块 ， 


ASSM。 
“MAXTRANS (最 大 事务 数量 ) : 省 
因 不 同 ， 但 都 会 导致 SQL 语 句 执行 过 程 中 访问 块 的 数 


则 请 求 该 块 信息 的 下 一 个 事务 必须 等 到 正在 使 用 该 块 的 某 一 事务 提交 或 回 退 才能 使 用 该 块 。MAXTRANS 参 数 限制 并 行使 用 某 个 数据 块 的 事务 处 理 的 数量 。 当 预计 有 许多 事务 处 理 将 并 行 访问 某 个 小 表 时 ， 则 
当 创建 表 时 ， 应 设置 该 表 的 事务 处 理 项 预 分 配 更 多 的 块 空间 ， 较 高 的 MAXTRANS 参 数值 允许 许多 事务 处 理 并 行 访问 。 注 意 : 在 10g 中 MAXTRANS 会 被 忽略 ， 不 管 参数 设置 为 多 少 ， 所 有 段 的 MAXTRANS 都 是 
此 我 们 应 该 尽量 减少 这 两 种 情况 的 发 生 。 


念 。 这 两 种 现象 的 成 


重要 的 概 
下 ，Oracle 将 会 迁移 整 行 数据 到 一 个 新 的 块 中 (假设 一 个 块 中 可 以 存储 下 整 行 数据 ) ，Oracle 会 保留 被 迁移 行 的 原始 指针 指向 新 的 存放 行 数据 的 块 ， 这 就 意味 着 被 迁移 行 的 ROW ID 是 不 会 改变 的 。 


行 链接 产生 在 第 一 次 插入 数据 的 时 候 ， 如 果 一 个 块 不 能 存放 一 行 记录 的 情况 下 。 这 种 情况 下 ，Oracle 将 使 用 链接 一 个 或 者 多 个 在 这 个 段 中 保留 的 块 存储 这 一 行 记录 ， 行 
候 事 可 以 存储 在 一 个 块 中 ， 由 于 更 新 操作 导致 行 长 增加 了 ， 而 块 的 自由 空间 已 经 完全 满 了 ， 这 个 时 候 就 产生 了 行 迁移 。 在 这 种 情况 


255% 
3. 行 链接 与 行 迁移 
行 链接 与 行 迁移 在 块 中 是 两 个 很 
行 链接 (ROW CHAINING) : 和 
当 一 行 记录 初始 插入 的 时 


易 发 生 在 比较 大 的 行 上 ， 例 如 行 上 有 LONG、LONG RAW、LOB 等 数据 类 型 的 字段 ， 这 种 时 候 行 链接 是 不 可 避免 会 产生 的 。 
问题 。 


链接 比划 


行 迁移 (ROW MIGRATION) : 


可 以 通过 ANALYZE 命 令 收集 表 的 信息 ， 以 判断 是 否 存在 严 


analyze table XXX compute statistics; 

select chain cnt from dba tables where table name = 'xxx' and owner = 'xxx'; 

// 需 要 区 分 两 者 的 不 同 ， 可 通过 下 面 的 方法 

select vsize (col1) + vsize (col2) + http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/... 

from table 

where rowid=xxxx; 

on 利用 上 面 语句 可 以 计算 出 记录 大 小 。 将 这 个 记录 的 大 小 与 块 大 小 进行 比较 ， 就 可 以 识别 出 具体 是 行 链接 还 是 行 迁移 了 。 此 外 ， 也 可 以 根据 dba_tables 表 中 的 字段 avg_row_len 来 做 一 个 粗略 的 估算 。 如 果 平 均 字 段 
# 


一 旦 出 现 严重 的 行 链接 、 行 迁移 问题 ， 可 以 通过 多 种 方式 解决 。 针 对 这 两 种 情况 ， 解 决 的 方法 不 同 。 对 于 行 迁移 的 清除 ， 一 般 来 说 分 为 两 个 步骤 : 第 一 步 ， 控 制 住 行 迁移 的 增长 ， 使 其 不 再 增多 ; 第 二 
步 ， 清 除 以 前 存在 的 行 迁移 。 行 迁移 产生 的 主要 原因 是 表 上 的 PCTFREE 参 数 设置 过 小 导致 的 ， 而 要 实现 第 一 步 控制 住 行 迁移 的 增长 ， 就 必须 设置 好 一 个 正确 合适 的 PCTFREE 参 数 ， 否 则 即使 清除 了 当前 的 行 
迁移 后 马上 又 会 产生 很 多 新 的 行 迁移 。 当 然 ， 这 个 参数 也 不 是 越 大 越 好 的 ， 如 果 PCTFREE 设 置 的 过 大 ， 会 导致 数据 块 的 利用 率 低 ， 造 成 空间 的 大 量 浪费 ， 因 此 必须 设置 一 个 合理 的 PCTFREE 参 数 。 行 链接 很 
难 消除 ， 完 全 消除 行 连接 ， 有 必要 用 较 大 的 数据 块 尺寸 来 重建 数据 库 。 


常用 方式 ， 是 使 用 EXP/IMP 工 具 导 入 、 导 出 来 处 理 行 迁移 。 


exp userid=scott/tiger file=./tl.dmp log=./tl.1og buffer=10000 feedback=5000 compress=n tables=t1 
drop table tl purge; 
imp userid=scott/tiger file=./tl1.dmp 1og=./t1.1og buffer=10000 feedback=5000 tables=tl1 


使 用 CTAS 的 方式 来 处 理 行 链接 。 


analyze table emp list chained rows into chained rows; 

create table chain tmp as 

select * from emp where rowed in (select head rowid from chained rows) ; 
delete from emp where rowed in (select head rowid from chained rows) 
insert into emp select * from chain tmp; 


第 9 章 特有 SQL 


Oracle 数 据 库 除 支 持 标准 SQL 外 ， 还 内 置 了 一 些 特 有 的 SQL 语句 。 在 某 些 特定 的 场合 下 ， 使 用 这 些 语句 可 以 达到 很 好 的 效果 。 下 


针对 常用 的 一 些 SQL 进 行 介绍 。 


回 


9.1 MERGE 


首先 我 们 来 看 看 MERGE 的 简单 语法 : 


MERGE [hint] INTO [schema .] table [t alias] USING [schema .] 
{ table | view | subquery } [t alias] ON ( condition ) 

WHEN MATCHED THEN merge update clause 

WHEN NOT MATCHED THEN merge insert clause; 


回 


从 语法 可 见 ，MERGE 操 作 在 一 个 语句 中 实现 了 两 部 分 功能 。 当 记录 匹配 时 ， 执 行 某 个 操作 ; 当 记 录 不 匹配 时 ， 执 行 另外 一 个 操作 。 当 然 ， 它 也 支持 只 执行 一 类 操作 。 下 面 通过 一 个 示例 具体 说 明 它 的 上 


SQL> create table emp (id int, name varchar2 (20) ) ; 
// 表 已 创建 
SQL> insert into emp values (1，'user1') ; 
// 已 创建 1 行 
SQL> insert into emp values (2，'user2') ; 
// 已 创建 1 行 
SQL> insert into emp values (3，'user3') ; 
// 已 创建 1 行 
SQL> commit; 
// 提 交 完 成 
SQL> create table empbak as select * from emp where 1=2; 
// 表 已 创建 
SQL> insert into empbak values (1, 'userl'); 
// 已 创建 1 行 
SQL> commit; 
// 提 交 完 成 
SQL> select * from empbak; 
ID NAME 
1 userl 

SQL> set autotrace on 
SQL> merge into empbak b 

2 using emp e 

3 on (b.id=e.id) 

4 when matched then update set b.name=b.name||e.name 

5 when not matched then insert (b.id, b.name) values (e.id, e.name) ; 


//3 行 已 合并 
// 执 行 计划 
| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | MERGE STATEMENT | | 3 1 186 | 7 (15% 4 Ou: VOL OL 
| 1 1 MERGE | EMPBAK | | | 1 | 
| 2 | VIEW | | 1 | 
过 | HASH JOIN OUTER | | 3 1 186 | 7 | 
| 4 1 TABLE ACCESS FULL| EMP | 分 | 3 (97 | V0 00: OL. | 
| 导 | TABLE ACCESS FULL| EMPBAK | 号 | | 3 (oO | 00: 00: OL | 
SQL> commit; 
// 提 交 完 成 
SQL> select * from empbak; 

ID NAME 

1 userluserl 

3 user3 

2 user2 


// 更 新 目标 表 empbak 存 在 的 记录 (id=1) 的 内 容 。 对 于 目标 表 不 存在 的 情况 ， 则 插入 记录 


9.2 INSERT ALL 


INSERT ALL 即 复合 表 插 入 ， 是 将 一 个 查询 结果 行 同时 插入 多 个 表 中 的 功能 。 使 用 INSERT ALL 带 来 的 好 处 就 是 ， 通 过 读 取 一 次 原 表 就 可 以 插入 多 张 目 标 表 ， 减少 了 重复 读 取 的 开销 。 其 语法 如 下 : 


INSERT [ALL] [conditional insert clausel] 

[insert into clause value clause] (subquery) ; 
"conditional insert clause" 
[ALL] [FIRST] 
[WHEN condition THEN] [insert into clause value clause] 


[ELSE] [insert into clause value clause] 


下 面 通过 一 个 示例 说 明 。 


insert al1 
when ott1<10000 then into small orders values (oid, ottl, sid, cid) 
when ott1>10000 and ott1<20000 then into medium orders values (oid; ottl, sid, cid) 
when ott1>20000 then into large orders values (oid, ottl, sid, cid) 
when ott1>29000 then into special orders 
select http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 
/村 计划 = 
INSERT STATEMENT 
MULTI-TABLE INSERT // 一 次 读 取 的 结果 提供 给 多 个 表 
INTO OF 'SMALL ORDERS ' 
INTO OF 'MEDIUM ORDERS' 
INTO OF 'LARGE ORDERS' 
INTO OF 'SPECIAL ORDERS' 
HASH JOIN 
TABLE ACCESS (FULL) OF 'EMP' 
TABLE ACCESS (BY INDEX ROWID) OF '‘'ORDERS' 
INDEX (RANGE SCAN) OF 'ORDERS IDX2' (NON-UNIQUE) 
// 示 例 中 的 原 表 是 EMP 和 ORDERS 的 关联 查询 结果 ， 根 据 条 件 的 不 同 ， 插 入 不 同 的 目标 表 中 


93 WITH 


WITH 即 定义 语句 块 。 它 出 现在 SELECT 语句 中 时 ， 将 一 个 查询 语句 定义 为 某 个 名 称 ， 并 可 在 后 续 的 查询 块 中 引用 。 当 查询 名 称 与 已 有 的 表 名 重复 时 ，WITH 定 义 的 查询 块 优先 级 高 。WITH 语 句 可 以 定义 
多 个 查询 ， 中 间 用 逗号 分 隔 。 


下 面 看 一 个 示例 。 


with 
dept_costs as // 定 义 查询 块 1 ( 
select department name, sum (salary) as dept total 
from employeeshttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/...) ， 
avg_cost as // 定 义 查询 块 2( 
select sum (dept total) /count (*) as dept avg 
from dept costs) 
select * from dept costs 
where dept total>http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 


order by department name; 


9.4 CONNECT BY/START WITH 


从 9i 开 始 ，Oracle 提 供 了 丰富 的 层次 查询 语法 及 函数 ， 以 满足 层次 化 数据 的 查询 和 格式 化 需求 。 其 中 包括 SELECThttp://www.hzcourse.com/resource/readBook? 
path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/...START WITHhttp://www.hzcourse.com/resource/readBook? 
path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/...CONNECT BYhttp://www.hzcourse.com/resource/readBook? 
path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/...PRIOR 语 法 ， 其 次 是 SYS_CONNECT_BY_PATH 函 数 提供 了 格式 化 层次 数据 的 功能 。 语 法 如 下 : 


SELECT {coll, col2http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/...}, 
[LEVEL|CONNECT BY ROOT|CONNECT BY ISLEAF|CONNECT BY ISCYCLE] 
FROM table name 和 的 
[WHERE] 
CONNECT BY {PRIOR coll=col2|coll=PRIOR col2} 
[START WITH] 
[ORDER [SIBLINGS] BY]; 


其 中 : 


“ CONNECT BY: CONNECT BY 子 句 说 明 每 行 数据 将 是 按 层次 顺序 检索 ， 并 规定 将 表 中 的 数据 连 入 树 形 结构 的 关系 中 。PRIOR 运 算 符 必须 放置 在 连接 关系 的 两 列 中 茶 一 个 的 前 面 。 对 于 节点 间 的 父子 
关系 ，PRIOR 运 算 符 在 一 侧 表 示 父 节点 ， 在 另 一 侧 表 示 子 节点 ， 从 而 确定 查找 树 形 结 构 的 顺序 是 自 顶 向 下 还 是 自 底 向 上 ; 当然 也 可 以 理解 为 递归 当前 层 数据 和 上 一 层 数据 之 间 的 关系 。 此 外 ，CONNECT BY 


子 句 也 可 以 不 限定 父子 关系 ， 比 如 执行 level<5 等 条 件 。 


“START WITH: START WITH 子 名 为 可 选项 ， 用 来 标识 哪个 节点 作为 查找 树 形 结构 的 根 节点 。 层 次 查询 需要 确定 起 始点 ， 通 过 START WITH 子 句 ， 后 面 加 条 件 〈 这 个 条 件 是 任何 合法 的 条 件 表 达 
式 ) 。START WITH 将 确定 将 哪 行 作为 ROOT， 如 果 没 有 START WITH， 则 每 行 都 当做 ROOT， 然 后 查找 其 后 代 。 这 不 是 一 个 真实 的 查询 。START WITH 后 面 可 以 使 用 子 查询 ; 如 果 有 WHERE 条 件 ， 则 会 截 


断层 次 中 满足 相关 条 件 的 节点 ， 但 不 影响 整个 层次 结构 。 
“LEVEL: 是 一 个 伪 列 ， 代 表 当 前 这 个 节点 所 在 的 层级 。 对 根 节点 来 说 ，LEVEL 返 回 !， 根 节点 的 子 节点 返回 >， 以 此 类 推 。 通 过 该 伪 列 结合 其 他 Oracle 函 数 进 行 数据 的 格式 化 显示 。 
-CONNECT BY ROOT: CONNECT_BY_ROOT 必 须 与 菜 个 字段 搭配 使 用 ， 目 的 是 获取 根 节点 记录 的 字段 信息 。 
“ CONNECT_BY_ISLEAF: 判断 当前 节点 是 否 为 叶子 节点 ，0 表 示 为 非 叶 子 节点 ，1 则 表示 为 叶子 节点 (如 果 不 存 在 下 级 节点 就 是 叶子 节点 ) 。 
“CONNECT BY_ISCYCLE: 可 以 检查 是 否 在 树 形 查 询 的 过 程 中 构成 循环 ， 这 个 伪 列 只 是 在 CONNECT BY NOCYCLE 方 式 下 有 效 。 
“ ORDER SIBLINGS BY: 定义 返回 时 同一 个 父亲 下 各 个 兄弟 之 间 的 顺序 。 


下 面 通过 一 个 示例 说 明 。 


SQL> create table emp (emp id int，emp_name varchar2 (10) , manager id int) ; 
SQL> select * from emp; 


EMP_ID EMP NAME MANAGER ID 
1 userl 0 
2 user2 L 
3 user3 1 
4 user4 2 
5 user5 2 
6 user6 3 


SQL> select emp id, emp name, manager id, level 


2 from emp 

3 start with emp id=1 

4 connect by prior emp id=manager id 
5 s 


order 


siblings by emp_id; 


EMP_NAME, 


MANAGER_ID 


通过 上 述 代 码 可 以 看 到 不 同 记录 的 
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第 10 章 ”查询 转换 


层次 (level) 信息 。 


查询 转换 是 Oracle 解 析 SQL 语 句 中 的 重要 步 又。 其 原理 是 通过 对 查询 语句 的 改写 ， 以 达到 生成 较 高 执行 效率 的 方式 。 当 然 ， 改 写 前 后 的 语句 在 语义 上 是 等 价 的 。 


10.1 ” 查 光 转换 的 分 类 及 说 明 


客户 端 


从 图 10-1 中 可 以 看 到 ， 当 
同 版 本 中 ， 它 的 处 理 机 制 是 不 一 样 的 。 根 


日 标 SQL 的 执行 结果 


待 执 行 的 SQL 语 折 


图 10-1 所 示 是 语句 提交 给 Oracle 后 的 解析 、 执 行 过 程 。 


优化 硕 〈Optimizer ) 


查询 转换 


实际 执行 


图 10-1 语句 提交 给 Oracle 后 的 解析 、 执 行 过 程 


Query 
Optimization 


执行 计划 


户 提交 的 语句 经 过 解析 之 后 ， 在 提交 给 优化 器 之 前 会 进行 一 个 查询 转换 的 步骤 。 在 这 个 步骤 中 ，Oracle 会 根据 一 些 规则 来 决定 对 目标 SQL 进行 何 种 查询 转换 。 在 Oracle 的 不 
届 处 理 方式 的 不 同 ， 查 询 转换 可 以 分 为 两 类 : 


: 启发 式 查询 转换 : 又 称 为 基于 规则 的 查询 转换 ， 是 基于 一 套 规则 对 查询 进行 转换 。 一 旦 满足 规则 定义 的 条 件 ， 则 对 语句 进行 相应 的 转换 ， 部 分 启发 式 转换 技术 在 RBO 时 代 就 已 经 被 引入 了 。 在 9i 
中 ，Otracle 会 内 置 一 些 查 询 转 换 规 则 ， 只 要 目标 SQL 满 足 了 这 些 规则 的 要 求 ，Otracle 就 会 对 其 执行 查询 转换 。 


“ 基于 代价 的 查询 转换 : 顾名思义 ， 这 种 方式 是 对 可 能 的 转换 结果 进行 成 本 估算 ， 是 否 对 语句 进行 转换 则 取决 于 语义 等 价 语句 之 间 的 代价 对 比 ， 即 采用 代价 最 小 的 一 种 。 在 10g 及 以 后 的 版 本 中 ，Oracle 
会 分 别 计算 经 过 查询 转换 后 的 等 价 改 写 SQL 的 成 本 和 原始 SQL 的 成 本 ， 只 有 当 等 价 改写 SQL 的 成 本 小 于 未 经 过 查询 转换 的 原始 SQL 的 成 本 值 时 ，Oracle 才 会 对 目标 SQL 执 行 这 些 查询 转换 。 因 为 对 这 种 可 能 转 
换 的 结果 进行 成 本 估算 ， 代 价 较 大 ， 因 此 Oracle 提 供 了 一 个 隐 含 参数 _optimizer_ cost_based_transformation ， 用 来 控制 是 否 进行 基于 代价 的 查询 转换 ， 以 及 如 何 进行 基于 代价 的 查询 转换 ， 从 而 限制 其 对 资源 的 


消耗 。 


常见 的 查询 转换 有 以 下 几 种 。 


视图 合并 
下 ， 以 用 户 所 要 
续 被 使 用 ， 而 视 


: 将 定义 视图 


图 


时 所 使 用 的 查询 语句 〈 视 


中 所 指定 的 那 部 分 查询 语句 自身 的 缺陷 ， 所 以 通过 这 种 方式 能 够 有 效 减少 使 用 视 


图 


查询 语句 ) 放 入 实际 执行 读 取 数 据 的 查询 语句 ( 读 取 查 询 语 句 ) 中 。 该 方式 在 有 的 条 件 下 可 以 实现 ， 但 是 在 有 的 条 件 下 无 法 实现 。 在 允许 的 条 件 
执行 的 查询 语句 为 基准 。 由 于 该 方式 能 够 弥补 视图 
中 的 查询 条 件 添加 到 查询 语句 中 去 。 这 样 做 对 整个 查询 几乎 不 会 产生 任何 不 良 影响 。 但 是 有 几 个 限制 条 件 需要 注意 ， 在 没有 遵循 这 些 限制 条 件 的 情况 下 无 法 实现 视图 的 合并 。 


而 带 来 的 代价 。 也 就 是 说 读 取 查询 语句 中 的 查询 条 件 继 


: 谓词 推 入 : 该 方式 以 无 法 实现 视图 合并 的 查询 语句 为 对 象 ， 将 读 取 查询 语句 中 的 查询 条 件 附 加 到 视图 查询 语句 中 去 ， 以 实现 查询 语句 转换 的 目的 ， 并 实现 最 优化 查询 。 在 该 方法 中 通过 利用 所 有 可 以 
利用 的 方法 来 最 大 程度 地 实现 谓词 推进 的 目的 ， 进 而 获得 良好 的 执行 计划 。 


“ 子 查 询 解 谋 套 : 解除 构成 子 查 询 的 查询 语 身 与 主 查询 语句 的 嵌 套 关系 或 者 通过 表 连 接 的 方式 代 蔡 子 查询 ， 以 获得 良好 的 执行 速度 。 事 实 上 ， 大 部 分 的 子 查询 几乎 都 要 经 过 转换 。 在 子 查询 非 谋 套 化 不 
可 能 实现 时 ， 优 化 器 会 制定 把 子 查询 放 在 最 优先 或 最 后 的 位 置 执行 的 独立 性 执行 计划 。 此 时 ， 这 个 查询 语句 的 执行 速度 会 随 着 子 查询 被 放 在 最 优化 或 最 后 位 置 执行 顺序 的 不 同 而 不 同 。 


: 消除 : 一 种 经 典 的 优化 规则 就 是 “尽量 少 做 ”， 消 除 类 的 查询 转换 就 是 贯彻 了 这 种 思想 。 通 过 优化 器 判断 ， 省 略语 句 中 的 一 些 不 必要 的 操作 ， 达 到 提高 运行 效率 的 目的 。 


下 面 看 看 最 常见 的 一 些 转换 。 


10.2 碍 i 多 转换 一 子 查询 类 


子 查 询 ， 是 SQL 中 常见 的 一 种 写法 。 对 于 优化 器 来 说 ， 子 查询 是 较 难 优化 的 部 分 。Oracle 提 供 了 多 种 方式 ， 对 子 查询 进行 查询 转换 。 
1. 子 查询 推进 


子 查询 推进 (又 称 子 查询 推 入 ) 是 指 优化 器 将 子 查询 提前 进行 评估 ， 使 得 优化 器 可 以 更 早 地 介入 优化 以 获得 更 优质 的 执行 计划 。 这 个 技术 可 以 通过 提示 PUSH_SUBQ/VNO_PUSH_SUBQ 控 制 。 下 面 通过 
一 个 示例 看 看 结果 。 


SQL> create table t users as select * from dba users; 
// 表 已 创建 
SQL> create index idx user created on t users (created) ; 
// 索 引 已 创建 
SQL> create table t objects as select * from dba objects; 
// 表 已 创建 
SQL> select /*+ no push subq (@inv) */ /*hfl*/ * 
2 from t objects u 


3 where created > 
4 (人 
5 select /*+ qb name (inv) */ max (created) 
6 from t users 
昱 人 
| Id | Operation | Name | 了 -Rows |E-Bytes| Cost (%CPU) |E-Time 
| 0 | SELECT STATEMENT | | | | 75 (100) | 
|* 1 | PILTER 1 | 1 | | 
| 2 | TABLE ACCESS FULL 
| T_OBJECTS | 18379 | 3715K| 74 | 
| 等. SORT AGGREGATE | | | 9 1 | 
| 4 |INDEX FULL SCAN (MIN/MAX) 
| IDX USER CREATED | 11 | 1 (0) | 


/* 在 这 个 语句 中 ， 我 们 通过 提示 强制 不 使 用 子 查询 推进 技术 。 由 执行 计划 可 见 ， 执 行 是 


SOL> select /*hf2*/ * 
2 from t objects u 


LOBJECTS 和 T_USRES 进 行 的 一 个 索引 的 谋 套 循环 。 


3 where created > 

4 (人 

5 select /*+ qb name (inv) */ max (created) 
6 from t users 

7 


| 0 | SELECT STATEMENT 


| | | | 75 (100) | 
I* 1 | TABLE ACCESS FULL 

| T_OBJECTS | 89 | 18423 | 74 (0) | 
| | SORT AGGREGATE | | 11 :| | 
| 3 |INDEX FULL SCAN (MIN/MAX) 

| IDX USER CREATED | | 9 | 1 (0) 1 


BEGIN OUTLINE DATA 
IGNORE OPTIM EMBEDDED HINTS 
OPTIMIZER FEATURES ENABLE ('11.2.0.2') 
DB_VERSION ('11.2.0.2') 
ALL ROWS 
OUTLINE LEAF (@"INV") 
OUTLINE LEAF (@"SELS1") 
OUTLINE (@"INV") 
FULL (@"SELS1" "U"@"SEL$1") 
PUSH SUBQ (@"INV") 
INDEX (@"INV" "T USERS"@"INV" ("T USERS"."CREATED") ) 
END OUTLINE DATRA 
* 
/ 


在 这 个 示例 中 ，Oracle 使 用 了 子 查询 推 入 技术 ， 且 可 以 在 OutLine 中 看 到 PUSH_SUBQ 字 样 。 从 执行 计划 可 见 ， 没 有 出 现 两 表 关联 ， 提 前 处 理 了 子 查询 ， 生 成 MAX CREATED， 然 后 全 表 扫 描 
T_OBJECTS 进 行 条 件 过 滤 ， 显 然 这 种 方式 效率 更 高 。 


2. 子 查询 解说 套 、 展 开 


子 查询 解 谋 套 是 指 优化 器 将 子 查询 展开 ， 和 外 部 的 查询 进行 关联 、 合 并 ， 从 而 得 到 更 优 的 执行 计划 。 可 以 通过 UNNEST/NO_UNNEST 提 示 控 制 是 否 进行 解 嵌 套 。 采 用 这 种 技术 通常 可 以 提高 执行 效率 ， 
原因 是 如 果 不 解 谋 套 ， 子 查询 往往 是 最 后 执行 的 ， 别 作为 FILTER 条 件 来 过 滤 外 部 查询 ， 而 一 旦 展开 ， 优 化 器 就 可 以 选择 表 关 联 等 更 高 效 的 执行 方式 ， 以 提高 效率 。 


下 面 通过 几 个 示例 说 明 各 种 解 嵌 套 的 形式 。 


先 看 第 一 个 示例 。 


SQL> create table t tables as select * from dba tables,; 
Table created. 
SQL> select * from t objects Oo where exists (select /*+ qb_name (inv) */ 1 from t tables t where t.owner=0.owner and t.table name=0.object name) ; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT | | 3689 | 453K| 376 (人 HO00: 00* 05° 1 
I* 1 | HASH JOIN RIGHT SEMI 

lL | 3689 | 453K| 376 (1) | 00: 00: 05 | 
| | TABLE ACCESS FULL| T TABLES | 2799 | 78372 | 3 (oh | 005 00: 0T 1 
| | TABLE ACCESS FULL| T OBJECTS | 86269 | 8256K| 344 {17 | QO0* O00: 05. | 


在 这 个 示例 中 ， 对 EXISTS 的 子 查 询 进行 了 解 谋 套 ， 然 后 选择 了 半 连 接 (SEMI JOIN) 的 关联 方式 。 


再 来 看 一 个 示例 。 


SQL> select * from t objects o where not exists (select /*+ qb name (inv) */ 1 from t tables t where t.owner=0.owner and t.table name=0.object name) ; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT | | 32422 | 3989K]| 376 (1) 4 90 00: 05 1] 
I* 1 | HASH JOIN RIGHT ANTI 


| 32422 | 3989K]| 376 (1) | 00: 00: 05 | 


1 
| 2 1 TABLE ACCESS FULL| T TABLES | 2799 | 78372 | 
3 


| TABLE ACCESS FULL| T_OBJECTS | 86269 | 8256K| 344 (1) | 00: 00: 05 | 


在 这 个 示例 中 ， 对 NOT EXISTS 的 子 查询 进行 了 解 庶 套 ， 然 后 选择 了 


3. 子 查询 分 解 


反 连 接 (ANTI JOIN) 的 关联 方式 。 


子 查询 分 解 是 由 WITH 创建 的 复杂 查询 语句 并 存储 在 临时 表 中 ， 可 按 


不 允许 语句 变形 ， 所 以 无 效 的 情况 较 多 。 下 面 看 一 个 示例 。 


据 集 还 是 构建 该 查询 复杂 的 扩展 形式 并 对 其 进行 优化 。 这 种 方式 的 优点 在 于 ， 使 用 WITH 子 句 的 子 查询 在 复杂 查询 语句 中 


Ea 
只 需 


琢 与 一 般 表 相同 的 方式 使 用 该 临时 表 的 功能 。 这 种 方式 可 以 把 一 个 复杂 的 查询 分 成 很 多 简单 的 部 分 ， 并 让 优化 器 去 决定 是 产生 中 间 数 


要 执行 一 次 ， 但 结果 可 以 在 同一 个 查询 语句 中 被 多 次 使 


。 缺 点 在 于 ， 这 种 方式 


SQL> with user obj as 
( 
select owner, count (*) cnt 
from t_objects 
group by owner 
) 
select u.user id, u.username, o.cnt 
from t users u, user obj o 
where u.username=0.owner; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT | | 24 | 1056 | 349 (1) 1 V0 B05 05 1 
I* 1 | HASH JOIN 1 1 24 | 1056 | 349 (1y 1 OO: 00 05: 1 
| 2 | VIEW 1 | 24 | 720 | 346 {1y | or DO O08 1 
| 3 1 HASH GROUP BY | | 24 | 144 | 346 人 M0900 851 
| 4 1 TABLE ACCESS FULL 
| T_OBJECTS | 86269 | 05 | 
| | TABLE ACCESS FULL| T USERS OE 1 
/* 子 查询 定义 为 User_obj， 在 执行 计划 中 以 一 个 视图 的 形式 (ID=2 的 步骤 ) 出 现 ， 并 与 7_USRES 进 行 了 哈 希 关联 
Wy 


上 述 过 程 并 没有 生成 临时 表 ， 可 通过 一 个 提示 materialize 强 制 优化 器 创建 临时 表 。 


SQL> with user obj as 
Sr 

3 select --+ materialize 
4 owner, count (*) cnt 
5 from t objects 

6 group by owner 
7 ) 
8 
9 
0 


select u.user id, u.username, o.cnt 
from t users u, user obj o 


10 where u.username=0.owner; 

| Id | Operation | Name | 
| 0 | SELECT STATEMENT | | 
| 1 | TEMP TABLE TRANSFORMATION | | 
| 部 | LOAD AS SELECT | SYS_TEMP OFD9D6604 18ElEE | 
| a. ] HASH GROUP BY | | 
| 41 TABLE ACCESS FULL | T_OBJECTS | 
上 天 | HASH JOIN | | 
| 6 | VIEW | | 
| 下 TABLE ACCESS FULL | SYS_ TEMP OFD9D6604 18ElEE | 
| 81 TABLE ACCESS FULL | T_USERS 1 
3 

4. 子 查询 合并 


在 语义 等 价 的 前 提 下 ， 如 果 多 个 子 查询 产生 的 结果 集 相同 ， 则 优化 器 可 以 使 


NO_COALESCE_SQ/COALESCE_SQ 提 示 来 控制 。 下 面 看 个 示例 。 


这 种 技术 将 多 个 子 查 询 合并 为 一 个 子 查询 。 这 样 的 好 处 在 于 减少 多 次 扫描 产生 的 开销 。 可 以 通过 


select /*+ qb name (mn) */ t.* 
from t tables 七 
where exists ( 
select /*+ qb name (sub1l) */ 1 
from t tablespaces ts 


where t,tablespace name=ts.tablespace name and ts.block size=8) 


and exists ( 
select /*+ qb name (sub2) */ 1 
from t tablespaces ts 
where t.tablespace name=ts.tablespace name) ; 


| Id | Operation | Name | Rows | Bytes | Cost ( 
| 0 | SELECT STATEMENT| | 820 | 202K| 
I* 1 | HASH JOIN RIGHT SEMI 
| | 820 | 202K| 
[| TABLE ACCESS FULL 
| T_TABLESPACES | | | 
任 三 洁 : TABLE ACCESS FULL 
| T_TABLES | 2460 | 581K| 


Predicate Information (identified by operation id) 
1 -~ access (PT ‘ABLESPACE NAME 
2 ~ filter ("Ts BLOCK SIZE"=8) 
$= filter (™ "TABLESPACE NAME" IS NOT NULL) 


34 (0) | 00: 00: 01 | 
34 (0) | 00: 00: 01 | 
3 (0) | 00: 00: 01 | 


31 (0) | 00: 00: 01 | 


/* 在 这 个 查询 中 ， 外 部 对 T_TABLES 表 的 查询 要 同时 满足 SUB1 和 SUB2 两 个 子 查询 ， 而 SUB1 在 语义 上 又 是 SUB2 的 子 集 ， 因 此 优化 器 将 两 个 子 查询 进行 了 合并 (只 进行 一 次 对 T_TABLESPACES 表 的 扫描 ) ， 然 后 与 外 部 表 T_TRBLES 进 不 


* 
/ 
// 那 么 如 果 语 义 不 等 价 又 会 怎么 样 呢 ? 
Select /*+ qb name (mn) */ t.* 
from 七 tables 七 
where exists ( 
select /*+ qb name (subl) */ 1 
from t tablespaces ts 


where t.tablespace name=ts.tablespace name and ts.block size=8) 


and exists ( 
select /*+ qb name (sub2) */ 1 
from t tablespaces ts 


where t.tablespace name=ts.tablespace name and ts.block size=16) ; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 


| 0 | SELECT STATEMENT | | 273 | 72072 | 


37 (0) | 00: 00: 01 | 


I* 1 | HASH JOIN RIGHT SEMI 


| | 273 | 72072 | (0) | 00: 00: 01 1 
[| TABLE ACCESS FULL 

|T_TABLESPACES | | | 3 Oy 00: 00* OF 1 
| 寺 , 刍 中 HASH JOIN RIGHT SEMI 

| I 820 | 202K| 34 (0) | 00: 00: 01 | 
|* 4 1 TABLE ACCESS FULL 

| T_TABLESPACES| | is | 3 (0) | 00: 00: 01 | 
[| TABLE ACCESS FULL 

| T_TABLES | 2460 | 581K| 对 (0) | 00: 00: 01 | 


Predicate Information (identified by operation id) : 


1 - access ("T"."TABLESPACE NAME, S"."TABLESPACE NAME") 
2 - filter ("TS"."BLOCK SIZE"=8) 

3 - access ("T"."TABLESPACE NAME"="TS"."TABLESPACE NAME.") 
4 - filter ("TS"."BLOCK SIZE"=]16) 

5 - filter ("T"."TABLESPACE NAME" IS NOT NULL) 


在 这 个 查询 语句 中 ， 外 部 查询 要 满足 两 个 子 查询 一 一 SUB1 和 SUB2， 但 两 者 条 件 不 同 ， 不 能 简单 合并 。 


描 ) ， 然 后 再 做 关联 查询 。 


5. 子 查询 实体 化 


子 查 询 实体 化 是 指 在 上 面 WITH 定 义 的 查询 中 ， 将 查询 结果 写 入 一 张 临时 表 中 ， 后 续 的 查询 直接 利 | 


临时 表 中 的 数据 。 可 以 通过 MATERIALIZE 提 示 来 控制 。 下 面 看 个 示例 。 


因此 在 执行 计划 中 ， 分 别 对 两 者 进行 了 扫描 (直观 感觉 就 是 对 T_TABLESPACES 进 行 了 两 次 扫 


SQL> with v as 
2 (select /*+ MATERIALIZE */ * from t users where username='SYS') 
3 select count (*) from v; 


SELECT STATEMENT 
TEMP TABLE TRANSFORMATION 
LOAD AS SELECT 


| 
| 
YS_TEMP OFD9D6606 18E1EE | 
| 
| 


SORT AGGREGATE 
VIEW 
TABLE ACCESS FULL 


| | 

| | 

| | S 
TABLE ACCESS FULL | T_USERS 
| | 

| 

| 1 


/* 在 ID=2 的 步骤 中 生成 了 一 张 
a 
SQL> with v as 
2 (select * from t users where username='SYS') 
3 select count (*) from v; 


| Id | Operation | Name | 
0 | SELECT STATEMENT | | 
1 | SORT AGGREGATE 1 | 
交 浊 TABLE ACCESS FULL| T USERS | 


// 不 再 生成 临时 表 ， 直 接 解 谋 套 执行 


临时 表 SYS_TEMP xxx， 并 且 这 个 临时 表 在 后 面 会 被 直接 使 用 。 如 果 去 掉 提 示 会 怎样 呢 ? 


10.3 ”查询 转换 一 一 视图 类 


视图 类 的 查询 转换 中 最 常见 的 就 是 视图 合并 ， 它 是 指 优化 器 将 视图 定义 语句 拆 解 开 来 ， 不 作为 整体 执行 ， 而 将 其 定义 语句 与 外 部 查询 合并 起 来 ， 由 优化 器 再 选择 执行 计划 。 当 然 ， 上 述 操作 的 前 提 是 合 


并 前 后 的 语句 是 语义 等 价 的 。 如 果 有 不 等 价 的 情况 ， 则 不 会 进行 合并 操作 。 也 就 是 说 不 是 所 有 情况 下 都 可 以 进行 视图 合并 。 这 种 转换 方式 往往 可 以 得 到 更 优 的 执行 计划 ， 原 因 是 优化 器 不 再 


图 定义 的 条 件 ， 而 在 一 个 更 大 的 范围 内 进行 优化 。 


根据 视图 定义 及 与 外 部 查询 的 关系 ， 可 以 把 视图 合并 分 为 三 种 形式 : 


: 简单 视图 合并 ; 


“ 外 连接 视图 合并 ; 


“ 复杂 视图 合并 。 


1. 简 单 视图 合并 


简单 视图 合并 指 视图 定义 中 不 包含 分 组 聚合 函数 ， 且 外 部 查询 不 包括 外 连接 的 情况 。 是 否 进行 视图 


_simple view_merging， 以 确定 是 否 允许 简单 视图 合并 ， 默 认 是 true。 


下 面 看 一 个 示例 。 


合并 ， 由 提示 MERGE/NO_MERGE 控 制 ， 默 认为 true。 系 统 内置 了 一 个 参数 


局 限于 原 有 的 视 


SQL> create View V_objl as select * from t objects where owner='SYS'; 
View created . 
SQL> select * from v objl where object_idq=10; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT | | 二 98 | 344 (1) | 00: 00: 05 | 
Il* 1 | TABLE ACCESS FULL| T_OBJECTS | 工 | | 344 (1) | 00: 00: 05 1 


Predicate Information (identified by operation id) : 


1 - filter ("OBJECT ID"=10 AND "OWNER"='SYS') 


/* 从 直接 计划 可 见 ， 已 经 没有 视图 对 象 出 现 了 。 视 图 内 部 的 过 滤 条 件 ONNER='SYS' 和 外 部 的 过 滤 条 件 OBJECT_ID= 10 都 被 合并 在 一 起 并 转换 为 对 基 表 T_OBJECTS 的 过 滤 条 件 


bd 
SQL> alter session set " simple view merging"=false; 
Session altered. 
SQL> select * from v objl where object iqd=10; 


| Id | Operation Name | Rows | Bytes | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT 1 开业 207 1 345 (人 00 00: 05- 1 
| 1 | VIEW V_OBJ1 | | 207 | 345 | 
[| TABLE ACCESS FULL| T OBJECTS | Eg 98 | 345 Ci MGs Gh 5] 


// 通 过 对 隐 含 参数 的 修改 ， 不 允许 进行 简单 视图 合并 动作 。 从 执行 计划 中 可 以 看 到 “VIEW” 字 样 


下 面 我 们 看 另外 一 个 示例 。 


SQL> create view v obj2 as select rownum rn, object id, object name , owner from t objects; 


View created. 
SQL> select * from v obj2 where object iqd=10; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time 


| SELECT STATEMENT | | 86269 | 9182K| 344 (1) | 00: 00: 051 
| VIEW | V_OBJ2 | 86269 | 9182K| 344 (1Y 1 ‘00s.00: 051 
| CoUNT | | | | | 1 

| TABLE ACCESS FULL| T OBJECTS | 86269 | 3032K| 344 (1) | 00: 00: 051 


0 
1 
2 
区 


/* 由 这 个 例子 中 可 见 ， 执 行 计划 中 出 现 了 视图 名 称 ， 也 就 是 说 视图 V_OBJ2 没 有 被 合并 。 这 是 因为 在 视图 定义 的 语句 中 ， 包 含 了 伪 列 函数 ROWNUM。 实 际 上 在 视图 的 定义 中 ， 包 含 伪 列 、 集 合 操作 、 层 次 查询 等 多 种 情况 都 会 导致 无 法 4 
*/ 
2. 外 连接 视图 合并 


外 连接 视图 合并 是 指 视图 与 外 部 查询 采用 外 连接 的 方式 ， 或 者 视图 定义 本 身 包含 了 外 连接 。 这 种 情况 下 ， 视 图 合并 的 条 件 比 较 苛刻 。 一 般 情况 下 ， 只 有 当 视图 作为 外 连接 的 驱动 表 或 者 虽然 是 被 驱动 表 
但 视图 定义 只 有 一 个 表 的 时 候 ， 才 会 使 用 这 一 特性 。 当 然 在 视图 的 定义 中 ， 同 样 不 能 包含 分 组 聚合 函数 。 


下 面 看 一 个 示例 。 


SQL> create or replace view V_obj3 as select u.user jd，u.username，o.object_ id, o.obJject_name from t objects o, t users u where 0.owner=u.username and o.object type='TABLE ' ; 
SQL> select v.object_name, 七 .Status 

2 from v_ obj3 v, 七 tables 七 

3 where Vv.object name=t.table name (+) ; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | 
| 0 | SELECT STATEMENT | | 1963 | 147K| 378 Cy | 
I* 1 | HASH JOIN 1 1 1963 | 147K]| 378 (1) | | 
| A | TABLE ACCESS FULL| T USERS 1 31 1 310 | 3 (0) | | 
I | HASH JOIN OUTER | 一 | 1963 | 128K| 375 (Ly |! 
I* 41 TABLE ACCESS FULL 

| T OBJECTS | 1961 | 78440 | 344 (17 4 O00 D0: O51 
| 地 |] TABLE ACCESS FULL ~ 

| T TABLES | 2799 | 75573 | 31 (0) | 00: 00: 01 | 


人 中 可 见 ， 没 有 VIEW 字样 出 现 。 视 图 作为 外 连接 的 驱动 表 ， 在 生成 执行 计划 时 做 了 外 连接 视图 合并 
// 如 果 作为 被 驱动 表 会 怎样 呢 ? 
SQL> select v.object name, 七 .Status 


2 from V_obj3 v, t tables 七 
3 where v.object name (+) =t.table name; 


| Id | Operation | Name | Rows | Bytes | Cost (SCPU) | 
| 0 | SELECT STATEMENT | | 2799 1 254K| 378 C1 | 
I* 1 | HASH JOIN OUTER | | 2799 | 254K| 378 《17 硬 | | 
| | TABLE ACCESS FULL| T TABLES | 2799 | 75573 | 31 (0) | | 
| 3 1 VIEW | V_OBU3 | 1961 | 126K| 347 Cy | 
I* 41] HASH JOIN | 一 | 1961 | 98050 | 347 ,让 | | 
| 全 "| TABLE ACCESS FULL 

| T_USERS | :| 310 1 县 (0) | 00: 00: 01 1 
| 二 | TABLE ACCESS FULL 

| T_OBJECTS | 1961 | 78440 | 344 Cy Or DO O05 1 


// 由 执行 计划 可 见 ， 视 图 被 原封 不 动 地 保存 下 来 ， 没 有 被 合并 ， 而 是 被 作为 独立 单元 执行 


3. 复 杂 视 图 合并 


复杂 视图 合并 与 简单 视图 合并 相 比 ， 在 视图 定义 语句 中 包含 分 组 聚合 函数 ， 这 种 情况 下 进行 的 视图 合并 ， 视 图 中 的 分 组 操作 往往 会 延迟 到 关联 发 生 之 后 再 进行 分 组 。 需 要 注意 的 是 ， 最 终 是 否 进 行 合 
并 ， 取 决 于 成 本 是 否 最 低 。 系 统 内 置 了 一 个 参数 complex_view_merging 来 确定 是 否 允 许 复杂 视图 合并 ， 默 认 是 true。 此 外 ， 还 有 一 个 提示 NO_MERGE 来 阻止 视图 合并 。 


下 面 看 一 个 具体 示例 。 


SQL> create or replace view V_obj4 as select owner, count (*) cnt from t objects group by owner; 
SQL> select u.user id, o.cnt ss 本 

2 fromv obj4 o, t users u 

3 where 0.owne: ‘Username; 


| 0 | SELECT STATEMENT | | | 44 | 347 (1) | 00: | 
| 1 | HASH JOIN | | | 44 | 347 (1) | 00: | 
| 他 ] TABLE ACCESS FULL| T_USERS | 11 14 | | (0) | 00: | 
| 3 1 VIEW | V_OBJ4 | | 30 1 344 (1y 905 | 
| 41 HASH GROUP BY [ 1 | 6 | 344 《1 1 oO0: | 
[| 权 | TABLE ACCESS FULL 

| T_OBJECTS | 3595 | 21570 | 344 (1) | 00: 00: 05 | 


A i de 说 明 没有 进行 视图 合并 。 由 执行 计划 也 可 见 ， 视 图 执行 完 的 结果 又 和 T_USERS 做 的 关联 。 那 这 里 为 什么 没有 进行 合并 ? 回想 前 面 的 说 明 ， 是 否 进行 合并 取决 于 成 本 是 否 最 低 。 不 合并 方式 的 成 本 是 


select /*+ merge (co) */ uv,user id, o.cnt 
2 fromv obj4 o, t users u 
3 where o.owner=u.username and o.owner='SYS'; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | 
| 0 | SELECT STATEMENT | | 二 并 32 1 348 | 
| 1 | HASH GROUP BY | | | 32 1| 348 《17y 
[| HASH JOIN 1 1 .3595 | 112K]| 347 Ly i 
| 二 3] TABLE ACCESS FULL 
| T_USERS | | 26 | 3 | 
I* 4 1 TABLE ACCESS FUIL 一 
| T_OBJECTS | 3595 | 21570 | 344 | 


104 ” 查 光 转换 一 一 谓词 类 


谓词 是 指 SQL 语 句 中 WHERE 部 分 对 数据 的 过 滤 条 件 。 在 Oracle 中 ， 提 供 了 多 种 针对 谓词 的 优化 手段 ， 下 面 分 别 介绍 。 


1. 过 滤 谓 词 推 入 


出 
网 


这 种 情况 是 指 在 查询 语句 中 ， 如 果 存 在 视 


， 可 以 将 视 


外 部 的 过 滤 条 件 推 入 视图 中 。 这 样 做 ， 可 以 尽早 过 滤 数 据 ， 提 高 查询 效率 。 下 面 看 一 个 示例 。 


SQL> create View v obj5 as select * from t objects where status='VRALID'; 
SQL> select * from (select * from v obj5) v where v.object id: 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT | | 工 | 3 | 344 hy Dor DOr C3 
I* 1 | TABLE ACCESS FULL| T OBJECTS | 工 | 98 | 344 《1 | 00: 002 05 | 


/* 这 和 我 们 想象 的 执行 计划 不 同 ， 没 有 使 用 谓词 推 入 ， 原 因 是 这 里 采用 了 前 面 讲 到 的 视图 合并 技术 。 下 面 将 通过 禁用 视图 合并 ， 看 看 结果 如 何 ? 
wf 


SQL> select /*+ no merge (v) */ * from (select * from v obj5) V where v.object id=20; 


| 0 | SELECT STATEMENT | | | 207 | 344 《1 1 O00: .002 05 1 
| 1 | VIEW | | | 207 | 344 区 0 
上 二 芝 寺 TABLE ACCESS FULL| T OBJECTS | | 98 | 344 C1 DO G0 05 | 


Predicate Information (identified by operation id) 

2 - filter ("OBJECT ID" 
/* 这 里 使 用 no_Imerge 提 示 ， 视 图 没有 被 合并 ， 在 ID=1 的 步骤 里 可 以 看 到 视图 字样 。 观 察 一 下 ID=2 的 步 又 ， 由 Preqdicate Information 可 见 ， 过 滤 条 件 是 OBJECT_ID=20 RND STATUS= “VALID”。 可 见 这 里 的 条 件 不 仅 包括 视 臣 
A 


2. 连 接 谓词 推 入 


这 种 方式 和 上 面 提 到 的 过 滤 谓词 推 入 类 似 ， 视 图 还 是 作为 独立 单元 运行 ， 但 外 部 查询 和 视图 之 间 的 连接 条 件 被 推 入 视图 定义 语句 的 内 部 。 目 的 是 利用 视图 定义 基 表 上 的 索引 ， 采 取 嵌 套 循环 的 方式 提高 
访问 效率 。 其 最 终结 果 是 外 部 查询 作为 嵌 套 的 外 层 循环 ， 内 部 循环 为 对 视图 定义 基 表 的 索引 扫描 。 系 统 内 置 了 一 个 隐 合 参数 一 一 _push_join_predicate， 来 确认 是 否 开启 推 入 谓词 功能 。 


区 


下 面 通过 示例 看 一 下 。 


SQL> create table empl as select * from scott.emp; 
Table created. 
SQL> create index idx empl on empl (empno) ; 
Index created. 
SQL> create or replace view emp view as 
2 select empl.empno as empnol from empl; 
View created. 
SQL> select /*+ no merge (emp view) */ emp.empno 
2 from empl emp, emp view 
3 where emp.empno=emp view.empnol (+) and emp.ename 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT | | 11 22 | 4 (0) | 00: 00: 01 | 
| 1 | NESTED LOOPS OUTER | | | 22 | 4 (0) | 00: 00: 01 | 
[| TABLE ACCESS FULL | EMP1 | | 20 1 3 (0) | 00: 00: 01 | 
| 3 1 VIEW PUSHED PREDICATE 

| EMP VIEW | 11 2 | 工 (0) | | 
I* 4 1 INDEX RANGE SCAN | IDX FMP1 1 | 13 1 四 (0) | | 


推 入 。 在 上 面 提示 的 谋 套 循环 中 ， 外 层 循环 是 对 EMP1 表 的 查询 ， 内 层 循 环 是 对 视图 EMP_VIEW 的 查询 ， 并 且 走 的 是 基于 索引 的 谋 套 循环 


人 ID=3 的 步骤 提示 走 了 谓 记 
四 
SQL> alter session set "Push join predicate"=false; 
Session altered. 
SQL> select /*+ no merge (emp view) */ emp.empno 
2 from emp, emp view 
3 where emp.empno=emp view.empno (+) and emp.ename ='FORD'; 


司 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT 上’ 1 | 23 | 6 Oy | OQ: -9002 QT 1 
I* 1 | HASH JOIN OUTER | | 11 23 | 6 (0% 1 DO O07 01 1 
司 : 沙 上 | TABLE ACCESS FULL | EMP 1 10 1 3 《0h | ‘00: 00: OE 1 
| :| VIEW | EMP VIEW | 14 1| 182 | 3 (QO 1 90 00 OL 1 
| 4 1 TABLE ACCESS FULL| EMPIT | 14 | 182 | 总 (0) | 00: 00: 01 | 


// 禁 用 参数 后 ， 不 再 进行 推 入 ， 转 而 通过 哈 希 连接 方式 实现 


10.5 ”查询 转换 一 一 消除 类 


1 排序 消除 


排序 消除 是 指 优化 器 在 生成 执行 计划 之 前 ， 将 语句 中 没有 必要 的 排序 操作 消除 (如 利用 索引 ) ， 避 免 在 执行 计划 中 出 现 排序 操作 或 由 排序 导致 的 操作 。 


SQL> select count (*) from (select * from t_users order by user id) ; 


| Id | Operation | Name | Rows | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT | | 11 3 Koy | -00 .007 0 | 
| 1 | SORT AGGREGATE 1 | 11 | | 

| a TABLE ACCESS FULL| T USERS | 3 | 号 (0) | 00: 00: 01 | 


0 recursive calls 
0 db block gets 
2 consistent gets 
0 physical reads 
0 redo size 

526 bytes sent via SQL*Net to client 

523 bytes received via SQL*Net from client 
2 SQL*Net roundtrips to/from client 
0 sorts (memory) 
0 sorts (disk) 

// 对 于 上 述 语 句 来 说 ， 其 排序 就 不 是 必须 的 。 在 后 面 的 Statistics 中 的 Sorts 部 分 可 以 看 到 都 为 0 


2. 去 重 消除 


如 果 语句 中 对 象 存在 主键 或 唯一 约束 ， 那 么 语句 中 的 DISTINCE 是 可 以 消除 的 。 


SQL> create table t users as select * from dba users; 
Table created. 
SQL> select distinct username from t users; 


| Name | Rows | Bytes | Cost gsCPU) | Time | 
| 0 | SELECT STATEMENT | | 31 1 527 | 4 (25) 1 00: 00: 0Q1 | 
| 1 | HASH UNIQUE | | 31 1 527 | 4 (25) | 00: 00: 01 | 
| 2 | TABLE ACCESS FULL| T USERS | 31 1| S27 | 3 (0) | 00: 00: 01 | 


// 默 认 走 了 全 表 扫 描 ， 使 用 了 HASH 去 重 

SQL> alter table t users add constraint uk username unique (username) ; 
Table altered. 

SQL> select distinct username from t users; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT | 1 3 中 527 1 下 (Qh 1 00: 0o2 OL 1 
| 1 | INDEX FULL SCAN | UK USERNAME | 3 527 | 1 (0) | 00: 00: 01 | 


表 消 除 是 指 当 两 个 表 关 联 且 存在 3 


外 键 关系 时 ， 优 化 器 可 以 消除 不 必 


的 表 访 问 以 提高 效率 。 此 外 ， 还 有 一 种 情况 是 表 间 使 


外 连接 的 情况 ， 


会 消除 不 必要 的 表 访 问 。 


SQL> alter table t tablespaces add primary key (tablespace name) ; 


Table 


SQL> alter table t tables add constraint t tables ts fk foreign key (tablespace name) 


Table 


altered. 


altered. 


SQL> select t.* from t tables t, t tablespaces ts where t.tablespace name=ts. tablespace name; 


(%CPU) 


| Time | 


| 0 
[二 二 


| SELECT STATEMENT 


| TABLE ACCESS FULL| T TABLES | 


| Name | Rows | Bytes | Cost 
l | 2460 | 581K| 31 
2460 | 581KI 1 


(0) 


| 00: 00: 01 | 
| 00: 00: 01 | 


Jj 


T_TABLES、T_TABLESPACES 两 张 表 存 在 主 外 键 关系 ， 当 对 T_TABLES 表 进行 查询 时 ， 虽 然 关 联 到 T_TABLESPACES， 但 其 实 是 不 需要 的 


ee 


SQL> select t.* from t tables t, t users u where t.owner=u.username (+) ; 


| 0 
| 1 


| SELECT STATEMENT 


| TABLE ACCESS FULL| T TABLES | 


1 
31 


| 1 2799 | 


区 799 | 


661K| 
661K| 


(0) 
(0) 


| 00: 00: 01 | 
| 00: 00: 01 | 


references t tablespaces (tablespace name) 


10.6 ”查询 转换 一 一 其 他 


1. 星 型 转换 


星 型 转换 是 一 类 特殊 的 查询 。 这 种 模式 是 由 一 个 事实 表 和 若 


维度 表 组 成 的 。 查 询 是 


实 表 引 


TT 


维度 表 。 其 原理 是 : 在 


实 表 同 维 表 关 联 的 每 个 连接 列 上 都 创建 有 位 图 索引 ， 然 后 通过 维 表 关 联 得 出 


的 结果 集 再 与 事实 表 多 个 列 的 位 图 索引 组 合 连 接 得 出 查询 结果 。 由 于 位 图 索引 占用 空间 很 小 ， 而 且 特别 适用 于 AND、OR 这 一 类 的 合并 查询 ， 因 此 查询 性 能 会 有 大 幅 提升 。 
SQL> create table t as select * from all objects; 
SQL> create table t type as select rownum type id, a.* from (select distinct object type from t) a; 
SQL> create table t_owner as select rownum owner id， a.* from (select distinct owner from t) a; 
SQL> create table t status as select rownum status id, a.* from (select distinct status from t) ai 
SQL> create table t_created as select rownum created id， a.* from (select distinct created from t) a; 
SQL> update 七 set object type= (select type id from t type b where t.object type=b.object type) ; 
SQL> update t set owner= (select owner id from t owner b where t.owner=b.owner) ; - 
SQL> update t set status= (select status id from t status b where t.status=b.status) ; 
SQL> alter table t add created date int; 
SQL> update t set created date= (select created id from t_ created b where t.created= b.created) ; 
SQL> commit; 
SQL> create table test as select * from t where 1=2; 
SQL> alter table test modify status int; 
SQL> alter table test modify owner int; 
SQL> alter table test modify object type int; 
SQL> insert into test select * from 七 ; 
SQL> insert into test select * from test; 
SQL> commit; 
SQL> alter session set star transformation enabled=true; 
SQL> create bitmap index idx type on test (object type) ; 
SQL> create bitmap index idx owner on test (owner) ; 
SQL> create bitmap index idx created on test (created date) ; 
SQL> create bitmap index idx_ status on test (status) 】 
SQL> exec dbms stats.gather table stats (ownname => 'hf', tabname 'test', cascade => true) ; 
SQL> exec dbms stats.gather table stats (ownname 'hf', tabname 'T OWNER', cascade => true) ; 
SQL> exec dbms_ stats.gather table stats (ownname 'hf', tabname "T_TYPE'， cascade => true) ; 
SQL> exec dbms stats.gather table stats (ownname 'hf', tabname 'T_ CREATED', cascade => true) ; 
SQL> exec dbms stats.gather table stats (ownname 'hf', tabname 'T_STATUS', cascade => true) ; 


// 以 上 是 准备 星 型 转换 的 示例 结构 和 数据 
SQL> select a.object id, a.object name 

2 from test a, 七 owner b, t type c, t created d, t status e 
3 where a.owner=b.owner id and 


4 a.object type=c.type id and 
5 a.created date=d.created id and 
6 a.status=e.status id and 
7 b.owner='SCOTT' and 
8 c.object type='TABLE' and 
9 d.created='2005-08-30: 15: 06: 10' and 
10 e.status='VALID'; 
Id Operation Name 
0 SELECT STATEMENT 
汪汪 HASH JOIN 
二 HASH JOIN 
千本 HASH JOIN 
* 4 HASH JOIN 
TABLE ACCESS FULL T_CREATED 
6 TABLE ACCESS BY INDEX ROWID TEsT 
7 BITMAP CONVERSION TO ROWIDS 
8 BITMAP AND 
9 BITMAP MERGE 
10 BITMAP KEY ITERATION 
和 于 上 TABLE ACCESS FULL T_CREATED 
BITMAP INDEX RANGE SCAN IDX CREATED 
13 BITMAP MERGE 
14 BITMAP KEY ITERATION 
二 5 TABLE ACCESS FULL T TYPE 
* 16 BITMAP INDEX RANGE SCAN| IDX TYPE 
17 BITMAP MERGE 
18 BITMAP KEY ITERATION 
赤 - 寺 人 TABLE ACCESS FULL T_OWNER 
20 BITMAP INDEX RANGE SCAN| IDX OWNER 
21 BITMAP MERGE 和 
2 BITMAP KEY ITERATION 
和 多 3 TABLE ACCESS FULL T_STATUS 
* 24 BITMAP INDEX RANGE SCAN IDX_STATUS 
* 25 TABLE ACCESS FULL T_OWNER 
兴 蓝 让 TABLE ACCESS FULL T_TYPE 
要 -本 志 TABLE ACCESS FULL T_STATUS 
Note 


- star transformation used for this statement 


// 上 面 的 SQL 执 行使 用 了 星 型 转换 ， 从 后 面 的 Note 部 分 可 以 明显 看 出 来 


2. 传 递 闭 包 


传递 闭 包 是 指 谓词 中 的 条 件 存在 一 定 逻辑 关联 关系 的 话 ， 优 化 器 可 以 进行 推导 。 例 如 : x>10 and y=x， 则 可 以 推导 出 y> 10。 这 里 要 求 运算 符 必须 是 


部 分 需要 是 常量 、SQL 函 数 、 字 符 串 、 绑 定 变 量 或 包含 相关 关系 变量 的 常量 公式 。 


下 面 看 一 个 示例 。 


、>、<、>=、<= 中 的 一 个 。 后 面 比较 的 


SQL> create table t userl as select * from t users; 


Table 


created. 


SQL> create table t user2 as select * from t users; 
Table created. 


SQL> select ul.* from t userl ul, t user2 u2 where ulL1.user . u2.user id=10; 


下 | 
| HASH JOIN | | | 
TABLE ACCESS FULL| T_USER1 | 1 | 2176 | 01 1 
| TABLE ACCESS FULL| T USER2 | 11 13 | 01 1 


2 - filter ("U 
3 = filter ("U2 虱 
/* 在 下 面 的 谓词 条 件 中 ， 注 意 到 第 2 条 U1.USER ID=10， 这 个 是 从 前 面 U1 .USER_ID=U2 .USER_ID 推 导 而 来 的 


3.OR 扩 张 


OR 扩张 是 指 查 询 语句 中 使 用 多 个 字段 进行 过 滤 ， 且 通过 OR 进行 关联 。Oracle 有 一 种 策略 是 将 其 转换 为 多 个 子 查 询 ， 并 将 最 终结 果 合 并 在 一 起 。 此 外 ， 系 统 还 提供 了 一 个 提示 一 一 USE_CONCAT, 它 将 


含有 多 个 OR 或 者 IN 运算 符 连接 起 来 的 查询 语句 分 解 为 多 个 单一 查询 语句 ， 并 为 每 个 单一 查询 语句 选择 最 优 查 询 路 径 ， 然 后 再 将 这 些 最 优 查 询 路 径 结 合 在 一 起 ， 以 实现 整体 查询 语句 的 最 优 目的 。 只 有 在 驱动 
查询 条 件 中 包含 OR 的 时 候 ， 才 可 以 使 用 该 提示 。 


SQL> select /*+ OR EXPAND (t_objects object id) */ * from t objects where object id= 10 or owner='SYS'; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT | | 27344 | 5527K]| 688 

| 1 | CONCATENATION | | | | 

| 二 辣 | TABLE ACCESS FULL| T OBJECTS | 26721 | 5401K| 344 

[| TABLE ACCESS FULL| T OBJECTS | 623 | 125K]| 344 


Predicate Information (identified by operation id) : 


3 - filter ("OBJECT ID"=10 AND LNNVL ("OWNER"='SYS') ) 
// 从 上 面 ID=1 的 步骤 中 可 以 看 出 ，OR_EXPAND 提 示 起 到 了 OR 扩张 的 效果 


4. 常 量 转换 


对 于 语句 涉及 的 计算 部 分 ， 优 化 器 会 提前 完成 所 有 可 能 的 数学 计算 工作 。 这 样 在 后 续 的 执行 过 程 中 就 不 需要 每 次 都 进行 计算 了 ， 而 是 只 在 转换 阶段 执行 一 次 。 


SQL> select * from emp where sal>100+1; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT 1 | 14 | 532 | | (0) | 00: 00: 01 | 
I* 1 | TABLE ACCESS FULL | EMP | 14 | 532 | 3 (0) | 00: 00: 01 | 


生 filter ) 
/ /谓词 部 分 是 一 个 表达 式 100+1， 这 里 进行 了 计算 ， 将 其 转换 为 101 


5.LIKE 转 换 


在 LIKE 查 询 条 件 中 没有 使 用 “%” 或 ”的 情况 下 能 够 使 用 “=” 来 简化 表达 式 的 写法 。 需 要 注意 的 是 ， 在 使 用 固定 长 度 的 数据 类 型 的 情况 下 ， 这 样 的 转换 有 可 能 得 到 不 同 的 结果 ， 因 此 只 有 在 长 度 可 


变 的 数据 类 型 下 才 可 以 进行 这 样 的 转换 。 


SQL> select * from emp where ename like ‘abc'; 


| SELECT STATEMENT | 下 
| TABLE ACCESS FULL| EMP | 11 38 | 3 (wo | 003 00: 0 1 


(oy | O00 OO: BL | 


1 - filter ("ENAME. abc') 
// 从 filter 部 分 可 以 看 出 ， 最 终 转换 为 “=” 的 形式 


6.IN/OR 转 换 

对 于 使 用 IN 的 条 件 表达 式 ， 可 以 通过 使 用 OR 运 算 符 将 其 分 解 为 具有 相同 功能 的 多 个 使 用 “=” 预算 符 的 条 件 表达 式 。 
SQL> select * from emp where ename in ('abc', 'def'); 

| Operation | Name | Rows | Bytes | Cost (%CPU) | Time 

| 0 SELECT STATEMENT | | 于 38 |] 3 (0) | 00: 0 | 

[a TABLE ACCESS FULL | EMP | rh 38 | 3 (0) | 00: 0 | 


Predicate Information (identified by operation id) : 


1 - filter ("ENAME"='abc' OR "ENAMF."='def') 
// 输 出 结果 将 IN 转 换 为 OR 的 等 值 匹配 


7.ANY 与 SOME 转 换 


对 于 使 用 ANY 或 者 "SOME 比较 运 算 符 的 条 件 表达 式 而 言 ， 可 以 通过 使 用 “= ”运算 符 和 OR 逻 辑 运算 符 将 其 转换 为 具有 相同 功能 的 条 件 表达 式 。 


SQL> select * from emp where sal > ANY (100，200) ; 


| Id Operation | Name | Rows | Bytes | Cost (%CPU) | 
| 0 SELECT STATEMENT 1 | 14 | S32 | 3 (0) | | 
上 志 坟 TABLE ACCESS FULL | EMP | 14 | 532 | 3 (0) | | 


Predicate Information (identified by operation id) : 


1 - filter ("SAL">100) 
//filter 部 分 可 以 看 出 ， 对 ANY () 条 件 进行 了 转换 
SQL> select * from emp where 1000>ANY (select sal from emp) ; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT | | 工 | 38 | 6 (0) | 00: 00: 01 | 
I* 1 | FILTER | | | | | 

| | TABLE ACCESS FULL| EMP | 14 | 532 | 3 (0) | 00: 00: 01 | 
聊 ;名 TABLE ACCESS FULL| EMP | a 8 | 3 (0) | 00: 00: 01 | 


Predicate Information (identified by operation id) : 


1 - filter ( EXISTS (SELECT 0 FROM "EMP" "EMP"” WHERE "SAL"<1000) ) 
3 - filter ("SAL"<1000) 


8.ALL 转 换 


在 括号 中 指定 多 个 项 时 可 以 通过 使 用 “=” 运算 符 和 AND 逻 辑 运 算 符 将 其 转换 为 具有 相同 功能 的 表达 式 。 在 ALL 的 后 面 即使 使 用 了 子 查询 也 可 以 利用 NOT ANY 将 


转换 为 使 用 EXISTS 的 子 查询 。 


SQL> select * from emp where sal > ALL (100，200) ; 


Td Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
0 SELECT STATEMENT | | 14 | 532 | 3 (0) | 00: 00: 01 | 
人 TABLE ACCESS FULL| EMP | 14 | 532 | he (0) | 00: 00: 01 | 


Predicate Information (identified by operation id) : 


1 - filter ("SAL">200) 
SQL> select * from emp where 1000>ALL (select sal from emp) ; 


Id Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 

0 SELECT STATEMENT | | 1 | 5 (0) | 00: 00: 01 | 
二 FILTER | | | | | | 

2 TABLE ACCESS FULL| EMP | 14 | 532 | 3 0 | V0 D0 OL 1 
| TABLE ACCESS FULL| EMP | 二 4 1 2 《097 | v0: 00: 01 1 


Predicate Information (identified by operation id) : 


1 - filter ( NOT EXISTS (SELECT 0 FROM "EMP" "EMP" WHERE LNNVL ("SAL"<1000) ) ) 
3 - filter (LNNVL ("SAL"<1000) ) 


9.BETWEEN 转 换 


使 用 比较 运算 符 BETWEEN 的 条 件 表达 式 可 以 通过 使 用 “> =” 和 “<=” 运 算 符 将 其 转换 为 具有 相同 功能 的 条 件 表达 式 。 


SQL> select * from emp where sal between 100 and 200; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT | | 下 38 | 莹 (oF | -00 G0: O01. 1 
I* 1 | TABLE ACCESS FULL| EMP | | 38 | 和 3 wy | 0 60 1 


Predicate Information (identified by operation id) : 


1 - filter ("SAL"<=200 AND "SAL">=100) 


10.NOT 转 换 


在 使 用 NOT 的 情况 下 ， 去 掉 该 逻辑 运算 符 的 方法 就 是 寻找 与 其 相反 的 比较 运算 符 并 直接 替代 。 在 子 查询 中 使 用 NOT 的 转换 情况 下 ， 为 了 去 掉 NOT 运 算 符 所 采用 的 方法 是 寻找 与 其 相反 的 比较 运算 符 并 直 


接 蔡 换 。 


SQL> select * from emp where not (sal <100) ; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT | | 14 | S32 1] 3 (0) | 00: 00: 01 | 
I* 1 | TABLE ACCESS FULL| EMP | 14 | 532 | 于 0} 1 00; 06; 01 | 


Predicate Information (identified by operation id) : 


1 - filter ("SAL">=100) 
SQL> select * from emp where not deptno= (select deptno from emp where empno=100) ; 


| 


| 0 | SELECT STATEMENT | | (0) | 00: 00 
I* 1 | TABLE ACCESS FULL | EMP | | 
Is 将 1 TABLE ACCESS FULL| EMP | 01 1| 


Predicate Information (identified by operation id) : 
1 -~ filter ("DEPTNO"<> (SELECT "DEPTNO" FROM "EMP" "EMP" WHERE "EMPNO"=100) ) 
2 - filter ("EMPNO"=100) 


第 11 章 访问 路 径 


访问 路 径 是 指 SQL 语 句 中 数据 库 对 象 的 访问 方式 。 它 也 是 影响 执行 计划 整体 性 能 的 主要 因素 。 曾 有 经 验 表明 ， 在 OLTP 型 系统 中 ， 超 过 60% 的 SQL 优 化 问题 都 是 通过 调整 访问 路 径 解 决 的 ， 而 且 调 整 访问 


路 径 也 是 总 体 调 优 成 本 中 最 低 的 一 种 方式 。 


根据 访问 对 象 的 不 同 ， 可 以 分 为 表 访 问 路 径 、 索 引 访问 路 径 等 多 种 。 下 面 详细 介绍 主要 的 访问 路 径 。 


11.1 ” 表 访 问 路 径 
表 访 问 路 径 ， 顾 名 思 义 是 指 对 表 的 访问 方式 ， 可 分 为 如 下 几 种 。 


11.1.1 全 表 扫 描 


全 表 扫 描 是 一 种 “万 能 ”的 查询 方式 。 任 何 对 数据 的 访问 需求 ， 都 可 以 通过 全 表 扫 描 的 方式 解决 。 在 逻辑 上 ， 这 种 方式 会 读 取 表 中 的 所 有 行 ， 然 后 检查 每 一 行 是 否 满足 语句 的 限制 条 件 。 物 理 上 ， 这 种 
方式 会 批量 读 取 高 水 位 线 下 的 每 个 数据 块 。 这 里 注意 两 点 ， 一 是 批量 读 取 ， 二 是 高 水 位 线 。 批 量 读 取 的 目的 是 为 了 减少 MO 次 数 ， 提 高 系统 的 吞吐 能 力 。 一 个 多 块 读 操作 可 以 使 一 次 MO 能 读 取 多 块 数据 块 


(db_block_multiblock_ read _count 参 数 设 定 ) ， 而 不 是 只 读 取 一 个 数据 块 ， 这 极 大 地 减少 了 MO 总 次 数 ， 提 高 了 系统 的 吞吐 量 。 所 以 利 


多 块 读 的 方法 可 以 十 分 高 效 地 实现 全 表 扫描 ， 而 且 只 有 在 全 表 扫 


描 的 情况 下 才能 使 用 多 块 读 操作 。 高 水 位 线 ， 在 前 面 已 经 提 到 过 了 ， 它 标识 着 数据 存放 的 最 高 点 。 常 见 的 DELETE 操 作 不 会 影响 高 水 位 线 ， 只 有 使 用 TRUNCATE 才 会 将 高 水 位 置 为 零 。 在 10g 以 后 的 版 本 ， 可 


以 通过 shrink 命 令 人 工 收缩 高 水 位 线 。 


一 般 情况 下 ， 全 表 扫 描 得 到 的 数据 库 将 放 入 缓冲 区 LRU 链 表 的 LRU 端 ， 也 就 是 尽快 被 淘汰 出 的 部 分 。 因 为 Oracle 认 为 全 表 扫 描 得 到 的 数据 应 该 是 临时 访问 的 ， 不 应 长 期 占用 缓冲 区 。 在 119 之 后 的 版 
本 ，Oracle 提 供 了 一 种 新 的 方式 来 处 理 全 表 扫 描 ， 称 为 直接 路 径 读 取 。 这 种 方式 的 独特 之 处 在 于 ， 数 据 块 将 不 保存 在 缓冲 区 中 ， 这 将 大 大 减少 栓 锁 的 使 用 ， 避 免 对 缓冲 区 的 冲击 。 当 然 这 种 方式 也 不 是 完全 
没有 问题 ， 因 此 很 多 系统 从 10g 升 级 到 11g 的 时 候 ， 要 特别 注意 这 个 问题 。 


在 优化 器 选择 扫描 方式 时 实际 是 在 寻求 一 个 平衡 ， 即 寻找 表 扫 描 和 索引 扫描 的 损益 分 界 点 。 对 于 数据 量 比较 少 的 表 而 言 ， 全 表 扫 描 与 索引 扫描 的 损益 分 界 点 为 15%。 对 于 数据 量 比较 多 的 表 而 言 ， 全 表 
扫描 与 索引 扫描 的 损益 分 界 点 可 能 会 小 于 5%。 而 对 于 存储 着 海量 数据 的 表 而 言 ， 全 表 扫 描 与 索引 扫描 的 损益 分 界 点 可 能 是 1%。 这 里 的 1% 是 指 即 使 通过 索引 扫描 来 从 表 中 读 取 1% 的 数据 ， 也 没有 直接 通过 
全 表 扫 描 读 取 数 据 有 效 。 当 然 上 面 这 些 数字 都 经 验 值 ， 实 际 都 以 成 本 为 最 终 考察 因素 。 此 外 ， 随 着 磁盘 技术 的 不 断 发 展 ， 特 别 是 闪存 技术 的 不 断 成 熟 ， 随 机 读 取 的 开销 减少 了 很 多 ， 换 名 话说 索引 访问 的 成 
本 大 大 下 降 了 ， 优 化 器 会 更 加 倾向 于 使 用 索引 扫描 方式 。 


下 面 来 看 看 常见 的 使 用 全 表 扫 描 的 场景 : 


: 大 范围 数据 读 取 的 情况 : 这 里 的 大 范围 是 个 相对 的 概念 。 一 般 来 说 ， 如 果 访问 表 中 的 大 部 分 数据 ， 用 表 扫 描 效 率 较 高 ; 如 果 访问 表 中 的 小 部 分 数据 ， 则 使 用 索引 访问 的 效率 较 高 。 这 里 就 涉及 一 
个 “损益 点 ”的 概念 ， 当 小 于 损益 点 时 ， 索 引 访问 效率 高 ; 当 高 于 损益 点 是 ， 表 访问 效率 低 。 这 不 是 一 个 具体 比例 ， 常 见 的 经 验 在 19%~10% 之 间 。 具 体 还 是 取决 于 当时 的 成 本 评估 。 


: 从 小 数据 表 中 读 取 数 据 的 情况 : 如 果 访问 的 数据 规模 较 小 ， 则 优化 器 倾向 于 通过 全 表 扫 描 的 方式 访问 整个 表 。 因 为 全 表 扫 描 使 用 了 多 块 读 的 机 制 ， 往 往 效率 是 很 高 的 。 当 然 ， 如 何 界 定 小 表 是 个 问 
题 ， 后 面 会 专门 介绍 这 个 问题 。 


: 按照 并 行 处 理 方式 读 取 数 据 的 情况 : 在 并 行 处 理 的 情况 下 ， 全 表 扫描 的 执行 速度 会 在 更 大 程度 上 得 到 提高 。 


: 使 用 FULL 提 示 的 情况 : 这 个 提示 告诉 优化 器 ， 使 用 全 表 扫描 访问 表 。 


下 面 通过 一 个 示例 ， 看 看 全 表 扫 描 并 说 明 一 下 11g 支 持 的 直接 路 径 读 取 机 制 。 


SQL> select count (*) from t objects; 


343 (oy ] O00 .00: 05 | 
| 


0 | SELECT STATEMENT | | 
| 1 | SORT AGGREGATE | | 
2 1 TABLE ACCESS FULL | T OBJECTS | 6293 
// 这 一 语句 执 行 的 是 一 个 典型 的 全 表 扫 描 操 作 。 下 面 看 一 下 ， 在 11g 默 认 情 况 下 ， 对 全 表 扫 描 的 处 理 
SQL> select vm.sid, vs.name, vm.value 
2 from vimystat vm, v$sysstat vs 
3 where vm.statistic# = vs.statistic# and vs.name in ('session logical reads', 'physical reads', 'physical reads direct') ; 
SID NAME VALUE 


OPP 


146 session logical reads 5 
146 physical reads 0 
146 physical reads direct 0 
// 记 录 一 下 当前 会 话 的 几 个 指标 
SQL> select count (*) from t objects; 
COUNT (*) 
86292 
SQL> select wm.sid, vs.name, vm.value 
2 from vimystat vm, v$sysstat vs 


3 where vm.statistic# = vs.statistic# and vs.name in ('session logical reads', 'physical reads', 'physical reads direct') ; 
SID NAME VALUE 
146 session logical reads 1342 
146 physical reads 1233 


146 physical reads direct 1233 
/* 再 次 查看 会 话 指标 。 两 次 查询 的 结果 差异 就 是 这 个 语句 的 消耗 。 可 见 这 个 语句 使 用 了 1233 次 物理 读 ， 而 且 这 些 物理 读 都 是 DIRECT 方 式 的 。 这 也 是 11g 对 全 表 扫 描 的 一 个 改进 之 处 。 那 么 对 应 于 之 前 ， 又 是 怎样 的 呢 ? 
ed 


SQL> exit 

[oracle@localhost ~]$ sqlplus hf/hf 

// 重 新 登录 一 个 会 话 

SQL> select vm.sid, vs.name, vm.value 
2 from vimystat vm, v$sysstat vs 


3 where vm.statistic# = vs.statistic# and vs.name in ('session logical reads', ‘'physical reads', 'physical reads direct') ; 
SID NAME VALUE 
146 session logical reads 51 
146 physical reads 0 
146 physical reads direct 0 


SQL> alter session set events '10949 trace name context forever'; 
// 使 用 一 个 事件 来 禁用 直接 路 径 读 动作 
SQL> select count (*) from t objects; 
COUNT (*) 
86292 
SQL> select vm.sid, vs.name, vm.value 
2 from vimystat vm, v$sysstat vs 


3 where vm.statistic# = vs.statistic# and vs.name in ('session logical reads', 'physical reads', 'physical reads direct') ; 
SID NAME VALUE 
146 session logical reads 1391 
146 physical reads 1186 


146 physical reads direct 0 
/* 从 前 后 结果 差异 来 看 ， 此 次 操作 使 用 了 1186 次 物理 读 ， 但 与 前 者 不 同 ， 这 里 没有 使 用 DIRECT 方式 读 取 。 此 外 ， 这 里 的 物理 读 次 数 较 前 者 也 少 了 一 些 ， 这 是 因为 这 种 方式 会 考虑 到 缓冲 区 中 缓存 的 数据 块 情况 ， 而 前 者 则 不 会 
3 


下 面 花 一 点 篇 幅 ， 专 门 介绍 一 下 11g 下 全 表 扫 描 使 用 直接 路 径 读 的 相关 内 容 。 


1. 直 接 路 径 读 


直接 路 径 读 是 指 SQL 语 句 绕 过 缓冲 区 ， 从 数据 文件 中 直接 读 到 PGA 中 。11g 中 的 一 个 新 特性 ， 即 全 表 扫 描 可 以 通过 直接 路 径 读 的 方式 来 执行 。 这 是 一 个 合理 的 变化 ， 因 为 它 的 前 提 假 设 是 全 表 扫 描 的 大 
量 数据 读 取 是 偶发 性 的 ， 使 用 直接 路 径 读 可 以 避免 大 量 数据 对 于 缓冲 区 的 冲击 。 这 种 处 理 方式 的 优点 有 : 


: 减少 对 缓冲 区 的 检 锁 使 用 ， 避 免 了 可 能 带 来 的 争 用 情况 。 


“ 物理 IO 的 大 小 不 再 取决 于 缓冲 区 所 在 的 块 ， 因 为 这 种 方式 不 会 考虑 数据 块 是 否 缓存 在 缓冲 区 中 ， 直 接 物 理 读 取 。 设 想 一 下 ， 某 一 8 个 块 的 extent 中 1、3、5、7 号 块 在 高 速 缓存 中 ， 而 2、4、6、8 块 没有 
被 缓存 ， 传 统 的 方式 在 读 取 该 extent 时 将 会 是 对 2、4、6、8 块 进行 4 次 db file sequential read， 这 是 一 种 十 分 可 怕 的 状况 ， 其 效率 往往 要 比 单 次 读 取 这 个 区 间 的 所 有 8 个 块 还 要 低 得 多 。 虽 然 Oracle 为 了 避免 这 种 情 
况 总 是 尽 可 能 地 不 缓存 大 表 的 块 ( 读 入 后 总 是 放 在 队列 最 冷 的 一 端 ， 而 direct path read 则 可 以 完全 避免 这 类 问题 ， 尽 可 能 地 单 次 读 入 更 多 的 物理 块 。 


当然 这 种 方式 也 有 缺点 : 
“ 在 直接 路 径 读 某 个 段 之 前 需要 对 该 对 象 进行 一 次 段 级 检查 点 操作 。 原 因 很 容易 理解 ， 不 做 检查 点 数据 就 不 会 落 盘 ， 而 直接 路 径 读 是 不 读 缓冲 区 的 。 


“ 可 能 导致 重复 的 延迟 块 擦 除 操作 。 所 谓 延 迟 块 擦 除 是 指 如 果 提 交 事 务 时 ， 修 改过 的 数据 块 已 经 被 写 回 到 数据 文件 中 (或 大 量 修 改 超出 10% 的 部 分 ) ， 再 次 读 出 该 数据 块 进行 修改 ， 显 然 成 本 过 高 。 此 
时 ，Oracle 选 择 延迟 块 清 除 ， 等 到 下 一 次 访问 该 块 时 再 来 清除 TTL 锁 定 信息 。Oracle 通 过 延迟 块 清除 来 提高 数据 库 的 性 能 ， 加 快 提交 操作 。 


系统 能 否 使 用 这 种 直接 路 径 读 方式 ， 取 决 于 很 多 因素 。 其 中 最 主要 的 因素 就 是 对 大 小 表 的 判断 ， 这 个 后 面 会 单独 说 明 。 此 外 ， 还 有 两 个 因素 会 影响 这 个 动作 。 一 个 是 _serial_direct_read， 这 个 参数 可 以 


启用 、 禁 用 串 行 直接 路 径 读 。 一 个 是 10949 事 件 (上 面 示例 中 有 ) ， 它 可 以 屏蔽 这 个 119 的 新 特性 ， 恢 复 到 传统 处 理 方式 。 


2. 大 小 表 扫描 


全 表 扫 描 和 等 待 时 间 相 关联 ， 往 往 伴随 着 “db file scattered read” 等待 。 区 分 大 小 表 是 因为 全 表 扫 描 可 能 引起 buffer cache 抖 动 。 默 认 情 况 下 ， 大 表 的 全 表 扫 描 会 处 于 LRU 未 端 ， 以 期 尽早 老化 ， 减 
少 buffer 的 占用 。 从 8i 开 始 ，Oracle 提 供 了 多 缓冲 区 技术 ， 给 我 们 提供 了 另 一 种 选择 。 针 对 不 同 的 表 ， 我 们 可 以 采取 不 同 策略 ， 使 内 存 使 用 更 加 有 效 。 


在 11g 中 是 否 对 表 执 行 直接 路 径 读 的 全 表 扫 描 ， 是 由 优化 器 根据 表 的 大 小 进行 判断 。 主 要 受 限于 两 个 参数 : 一 个 是 small_table_threshold， 它 代表 一 个 小 表 的 阀 值 (如 果 表 大 于 5 倍 的 小 表 限制 ， 则 
动 使 用 直接 路 径 读 ， 代 蔡 传 统 读 的 方式 ) ; 另 一 个 是 very_large_object_threshold， 当 表 大 于 0.8 倍 的 这 个 参数 时 ， 也 会 使 用 直接 路 径 读 。 


11.1.2 ROWID 扫 描 


ROWID 是 指 某 一 行 所 在 数据 文件 、 数 据 块 以 及 行 在 该 块 中 的 位 置 。rowid 扫 描 是 指 按照 ROWID 来 访问 数据 ， 这 种 方式 可 以 快速 定位 到 目标 数据 上 ， 也 是 Oracle 访 问 单行 数据 最 快 的 方法 。 至 于 如 何 获 
得 ROWID， 可 以 有 多 种 方法 ， 可 以 通过 显 式 指定 ， 也 可 以 通过 索引 获得 。 这 种 方式 的 局 限 性 较 大 ， 主 要 是 因为 ROWID 并 非 固定 的 ， 其 变化 可 能 是 源 于 版 本 的 变化 或 数据 执行 了 导入 、 导 出 等 操作 。 此 外 ， 
这 种 方式 对 只 获取 特定 一 条 记录 来 说 是 最 快 的 方法 ， 但 是 使 用 它 来 获取 大 量 数据 则 不 是 好 方法 。 常 用 的 场景 是 在 批量 处 理 中 ， 首 先 在 执行 由 DECLARE CURSOR 所 声明 的 查询 语句 的 同时 将 其 执行 结果 一 起 
与 ROWID 进 行 存储 ， 然 后 对 其 加 工 处 理 过 的 结果 进行 再 次 修改 时 ， 为 了 提高 执行 速度 而 使 用 了 之 前 存储 的 ROWID。 


下 面 看 看 示例 。 


SQL> create table 七 objects as select * from dba objects; 
SQL> select rowid from t objects where rownum<2; 


ROWID 
AAAVaTAAEAAACNjAAA 
SQL> select * from t objects where rowid="'AAAVaTAAEAAAChjAAA'; 
| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT | | | 219 | 1 (0) | 00: 00: 01 | 
| 1 | TABLE ACCESS BY USER ROWID 

| T_OBJECTS | | Fa | 1 (0) | 00: 00: 01 | 


/* 从 执行 计划 中 看 到 “TABLE ACCESS BY USER ROWID” 字 样 ， 其 通过 显 式 指定 ROWID 的 方式 访问 单行 数据 
的 
/ 


SQL> create index idx object id on t objects (object id) ; 
Index created. 
SQL> select * from t objects where object id=20; 


| Id | Operation | Name | Rows | Bytes | 

0 | SELECT STATEMENT 及 207 | 
| 1 | TABLE ACCESS BY INDEX ROWID| T_OBJECTS | | 207 | 
[| INDEX RANGE SCAN | IDX OBJECT ID | | | 


/* 从 执行 计划 中 可 见 “TABLE ACCESS BY INDEX ROWID” 字 样 ， 这 是 通过 索引 (IDX_OBJECT_ID) 得 到 的 行 ROWID， 然 后 再 通过 表 得 到 对 应 的 行 记录 
Af 


11.1.3 ”采样 扫描 


采样 扫描 是 一 类 特殊 的 扫描 方式 ， 它 是 从 表 中 读 取 用 户 指定 比例 且 满 足 条 件 的 数据 。 需 要 注意 的 是 ， 即 使 在 从 数据 量 较 少 的 表 中 读 取样 本 数据 时 ， 所 返回 的 数据 也 不 是 一 个 固定 的 值 。 即 使 反复 执行 相 
同 的 SQL 时 ， 由 于 每 次 读 取 的 并 非 相同 的 数据 块 或 者 相同 的 行 数 ， 所 以 返回 的 结果 也 不 相同 。 这 种 访问 方式 主要 用 在 数据 分 析 等 场景 ， 不 需要 返回 所 有 数据 ， 只 需要 返回 部 分 数据 即 可 。 在 系统 中 ， 常 见 的 
统计 信息 收集 的 动作 ， 后 台 也 是 调用 的 这 种 扫描 方式 。 有 一 点 需要 注意 ， 这 种 方式 从 全 部 数据 块 中 读 取 指定 比例 的 数据 块 ， 每 次 读 取 的 数据 块 都 是 不 同 的 ， 即 返回 的 数据 也 不 同 。 


采样 扫描 的 语法 如 下 : 


select http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 
from table name SAMPLE {BLOCK option} (sample percent) 
where http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/O0EBPS/Text/... 


采样 扫描 支持 两 种 方式 ， 一 种 是 指定 记录 的 采样 ， 一 种 是 指定 块 的 采样 。 对 第 一 种 方式 来 说 ， 会 扫描 所 有 块 ， 然 后 按 比例 返回 记录 。 第 二 种 方式 则 会 扫描 指定 比例 的 数据 块 。 


下 面 来 看 个 示例 : 


SQL> select * from t objects sample (1) ; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT | | 9 | 1971 | 343 {0) 1 00: 00: 05 | 
| 1 | TABLE ACCESS SAMPLE| T_OBJECTS | S91 T1971 | 343 | 


// 注 意 执 行 计划 中 的 “TABLE ACCESS SAMPLE” 字 样 ， 这 表明 采用 的 是 采样 扫描 方式 


11.2 B 树 索引 


访问 路 径 


在 开始 介绍 B 树 索引 访问 路 径 之 前 ， 先 来 简单 回顾 一 下 B 树 索引 的 结构 。B 树 索引 是 以 一 种 平衡 树 (Balance Tree) 的 形式 保存 数据 的 。 结 构 上 分 为 根 节点 (Root Node) 、 分 支 节点 (Branch 
Node) 、 叶 子 节点 (Leaf Node) 。 树 中 的 最 底层 的 块 (也 就 是 叶子 结 点 ) 包含 了 每 个 索引 键 值 和 一 个 指向 表 中 记录 行 的 ROWID。 查 询 数据 根据 索引 值 ， 取 得 ROWID; 再 由 ROWID 取 出 数据 。B 树 的 特 
性 之 一 是 所 有 叶 块 都 应 该 在 树 的 同一 层 上 ， 该 层 称 为 索引 的 高 度 。 叶 节点 中 的 条 目 指向 具体 的 ROWID 或 ROWID 的 一 个 范围 。 大 多 数 B 树 索引 将 有 2 或 3 的 高 度 ， 平 均 对 应 上 百 万 的 记录 。 这 意味 着 它 将 花费 2 


或 3 个 MO 来 查找 索引 的 主键 。 


+ 


B 树 索引 的 扫描 过 程 是 首先 从 数据 字典 中 到 索引 段 头 的 块 地址 ， 这 个 块 地 址 后 面 的 块 就 是 索引 根 节点 块 地址 。 通 过 根 节点 定位 到 分 支 节点 ， 再 通过 分 支 节点 定位 到 下 一 级 分 支 节点 ， 直 到 最 后 定位 到 叶子 
节点 。 然 后 由 定位 到 的 叶子 节点 确定 的 扫描 方向 ， 从 左 向 右 或 从 右 向 左 扫描 。 注 意 无 论 是 向 左 还 是 向 右 扫描 ， 都 是 一 个 有 序 的 结果 。 在 从 索引 中 扫描 到 数据， 包括 ROWID 之 后 ， 如 果 所 获得 的 数据 已 经 满足 
需要 ， 则 将 数据 返回 给 上 一 步 ;否则 需 根据 ROWID， 再 从 表 中 获得 数据 返回 上 一 步 。 


下 面 来 看 看 几 种 具体 的 扫描 方式 。 


1. 索 引 唯 一 扫描 


通过 唯一 索引 查找 一 个 数值 经 常 返回 单个 ROWID。 如 果 存 在 UNIQUE 或 PRIMARY KEY 约 束 ( 它 保证 了 语句 只 存 取 单行 的话，Oracle 经 常 实现 唯一 性 扫描 。 在 大 部 分 情况 下 该 扫描 方式 主要 被 使 用 在 


4 


检索 唯一 ROWID 的 查询 中 。 为 了 进行 索引 唯一 扫描 而 必须 基于 主键 来 创建 索引 或 者 创建 唯一 索引 ， 且 在 SQL 语句 中 必须 为 索引 列 使 用 “=” 比较 运算 符 。 否 则 即使 基于 具有 唯一 值 的 列 创建 了 索引 ， 在 执行 


时 优化 器 也 不 可 能 选择 索引 唯一 扫描 ， 而 会 选择 范围 扫描 。 


Oracle 也 提供 了 一 个 提示 一 一 INDEX， 来 指定 完成 这 种 扫描 的 方式 ， 但 是 在 大 多 数 情况 下 没有 必要 使 用 该 提示 。 在 条 件 满足 的 情况 下 优化 器 将 无 条 件 地 选择 索引 唯一 扫描 ; 如 果 在 优化 器 没有 选择 该 扫 
描 方式 的 条 件 下 ， 即 使 在 SQL 语句 中 使 用 了 提示 ， 优 化 器 也 会 将 其 忽略 。 一 般 只 有 在 通过 DB LINK 远 程 访问 的 时 候 ， 优 化 器 才 可 能 无 法 选择 出 较 好 的 执行 计划 ， 此 时 需要 使 用 该 提示 进行 扫描 方式 的 指定 。 


SQL> create table t objects as select * from dba objects; 
Table created. 

SQL> alter table t objects add primary key (object id) ; 
Table altered. 

// 这 里 加 入 了 一 个 主键 约束 ， 系 统 会 自动 在 后 台 创 建 一 个 唯一 性 索引 
SQL> select * from t objects where object_idq=10; 


| Id | Operation | Name | Rows | Bytes | 
| 0 | SELECT STATEMENT | | | 
| 1 | TABLE ACCESS BY INDEX ROWID| T OBJECTS 1 1| 2071 
I* 2 | INDEX UNIQUE SCAN | SYS_c0011156 | 11 1 


/* 执 行 基于 单个 数值 的 等 于 操作 ， 最 终 的 索引 扫描 方式 为 INDEX UNIQUE SCRN， 并 在 此 次 操作 中 返回 RONID， 而 这 个 ROWID， 又 提供 给 上 一 步 操作 ， 走 了 IDNEX ACCESS BY INDEX RONID。 其 中 ，ID=2 步 骤 对 应 的 对 象 SYS_C00 
ww 

// 下 面 看 看 使 用 IN 等 其 他 情况 

SQL> select * from t objects where object id in (10); 


0 SELECT STATEMENT 

1 TABLE ACCESS BY INDEX ROWID| T_OBJECTS 

2 INDEX UNIQUE SCAN SYS_C0011209 
// 不 仅 使 用 “=” 可 以 使 用 索引 唯一 扫描 ，IN 一 个 单 值 也 是 可 以 的 
SQL> select * from 七 objects where object id between 10 and 10; 


0 | SELECT STATEMENT 
1 TABLE ACCESS BY INDEX ROWID| T_OBJECTS 
2 INDEX UNIQUE SCAN SYS_C0011209 


人 索引 唯一 扫描 。 因 为 即使 操作 符 不 同 ， 但 是 谓词 还 是 可 以 精确 定位 到 一 条 记录 ， 因 此 也 会 走 唯一 扫描 


// 下 面 换 一 个 实现 方式 ， 看 看 效果 
SQL> select * from t objects where object id between 10.0 and 10.9; 


0 | SELECT STATEMENT | | 
1 | TABLE ACCESS BY INDEX ROWID| T_OBJUECTS | 
2 1 INDEX RANGE SCAN | SYS_C0011210 | 


为 范围 扫描 ， 虽 然 字段 object id 为 整数 ， 谓 词 条 件 实际 也 是 对 应 object_id=10 的 ， 但 是 优化 器 没有 那么 智能 ， 只 能 通过 范围 扫描 返回 数据 


* 执 行 计划 
/ 


除了 在 单 表 查 询 中 使 用 索引 唯一 扫描 外 ， 在 表 间 关联 查询 中 也 经 常会 使 用 这 种 扫描 方式 。 下 面 看 一 个 示例 。 


SQL> create table emp as select * from scott.emp; 

Table created. 

SQL> create table dept as select * from scott.dept; 

Table created 。 

SQL> alter table emp add constraint pk emp primary key (empno) ; 

Table altered. 

SQL> alter table dept add constraint pk dept Primary key (deptno) ; 

Table altered. 加 

SQL> select e.*, d.* from emp e，dept d where e.deptno=d.deptno and e.empno=7499; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | 
| 0 | SELECT STATEMENT | | | 本 | 2 (0) | | 
| 1 | NESTED LOOPS | | 所 (0) | | 
| 2 | TABLE ACCESS BY INDEX ROWID 

| EMP | | 87 | 1 (0) | 00: 00: 01 | 
| 渤 . 党 中 INDEX UNIQUE SCAN | PK EMP | | | 0 《ot 00: 00¢ OE 1 
| 41 TABLE ACCESS BY INDEX ROWID 

| DEPT | 11 :| 1 (0) | ] 
|] INDEX UNIQUE SCAN | PK DEPT | 于 让 | 0 (0) | | 


1 hd din sie st Hd 然后 根据 其 deptno 信 息 ， 在 Gept 表 上 依据 索引 进行 查询 。 在 散 套 循环 中 ， 驱 动 表 使 用 了 主键 索引 唯一 扫描 确定 一 条 记录 ， 在 内 层 循环 中 ， 使 用 了 被 驱动 表 的 主键 索引 ， 同 样 利 用 


2. 索 引 范围 扫描 


索引 范围 扫描 是 索引 最 普遍 的 数据 读 取 方式 。 索 引 范 围 扫描 顾名思义 就 是 扫描 一 组 数据 ， 并 且 这 组 数据 是 在 一 个 范围 内 。 具 体 实现 方式 是 根据 指定 条 件 ， 从 根 节点 、 分 支 节 点 、 叶 子 节点 中 找到 范围 扫 
描 的 起 点 ， 然 后 进行 连续 扫描 。 根 据 扫描 方向 的 不 同 ， 索 引 范 围 扫描 可 分 为 升序 扫描 和 降序 扫描 。 


常见 使 用 范围 扫描 的 情况 ， 有 以 下 三 种 : 


“ 在 唯一 索引 列 上 使 用 了 范围 操作 符 (><<>>=<=between) 。 


“ 在 组 合 索引 上 ， 只 使 用 部 分 列 进行 查询 ， 导 致 查询 出 多 行 。 


: 在 非 唯一 索引 列 上 进行 的 任何 查询 。 


下 面 通 过 一 个 示例 说 明 各 种 索引 扫描 方式 发 生 的 场景 。 


SQL> create table t objects as select * from dba objects; 

Table created. 宙 加 

SQL> create unique index idx object id on t objects (object id) ; 
Index created. 本 加 本 站 

// 创 建 了 一 个 唯一 索引 

SQL> create index idx owner name on t objects (owner, object name) ; 
Index created. 

// 创 建 了 一 个 组 合 索引 

SQL> create index idx status on t objects (status) ; 

Index created. 


0 | SELECT STATEMENT | 101 | 
1 TABLE ACCESS BY INDEX ROWID| T OBJECTS | 101 | 
和 福 INDEX RANGE SCAN IDX OBJECT ID | L601 | 


索引 的 范围 访问 ， 这 里 走 了 索引 范围 扫描 “INDEX RANGE SCAN” 
SQL> select * from t objects where owner='HF'; 


0 | SELECT STATEMENT | 
下 TABLE ACCESS BY INDEX ROWID| T_OBJECTS | 30 1 
2 INDEX RANGE SCAN IDX OWNER NAME | 


SELECT STATEMENT | | 
TABLE ACCESS BY INDEX ROWID| T OBJECTS | 
INDEX RANGE SCAN | IDX STATUS | 


在 范围 扫描 中 ， 通 过 该 扫描 方式 检索 出 来 的 行 的 顺序 与 索引 中 的 顺序 相同 ， 即 使 在 查询 语句 中 使 


了 ORDER BY， 优 化 器 也 会 根据 


体 情况 进行 判断 。 如 果 ORDER BY 所 要 求 的 排序 列 和 排序 顺序 与 索 


引 中 的 排序 列 和 排序 顺序 完全 一 致 ， 则 不 再 执行 额外 的 排序 动作 ， 即 忽视 查询 语句 中 的 ORDER BY 子 句 。 下 | 


通过 一 个 示例 看 一 下 。 


SQL> select * from 七 objects where object id between 100 and 200 order by object id; 


| Id | Operation | Name | 

| 0 | SELECT STATEMENT | | 

| 1 | TABLE ACCESS BY INDEX ROWID| T OBJECTS | 
| 


INDEX RANGE SCAN | IDX_OBJPCT ID | 


0 sorts (memory) 

0 sorts (disk) 
On 虽然 语句 后面 指定 了 ORDER BY， 但 实际 并 没有 产生 排序 动作 。 这 点 可 从 Statistics 中 观察 到 
四 


上 面 是 按照 索引 列 进行 的 升序 排列 ， 如 果 是 降序 又 会 怎么 样 呢 ? 这 就 引入 了 另外 一 种 扫描 方式 一 一 索引 降序 扫描 。 索 引 降 序 范 围 扫 描 除 了 是 按照 降序 从 表 中 读 取 数 据 之 外 ， 其 他 的 部 分 都 与 索引 范围 扫 


描 相 同 。 一 般 情 况 下 索引 是 按照 升序 对 索引 列 值 进行 排序 的 ， 而 该 扫描 方式 则 是 从 最 大 的 值 开始 按照 降序 的 方式 连续 扫描 叶 块 ， 直 至 扫描 到 最 小 值 为 止 。 降 序 索引 范围 扫描 ， 还 可 以 通过 指定 提示 


INDEX_DESC 来 完成 。 下 面 看 一 个 示例 。 


SQL> select * from t objects where object id between 100 and 200 order by object id desc; 


| Id | Operation | Name | 
| 0 | SELECT STATEMENT | | 
| 1 1 TABLE ACCESS BY INDEX RONID | T OBJECTS | 
I* 2 | INDEX RANGE SCAN DESCENDING| IDX_ OBJECT TD | 
// 从 执行 计划 中 看 到 了 “INDEX RANGFE SCAN DESCENDING”， 表 明 这 就 是 一 个 索引 降序 扫描 


索引 范围 扫描 的 有 序 结果 可 以 对 诸如 排序 等 操作 带 来 很 大 的 帮助 。 下 面 看 一 个 示例 。 


SQL> select e.*, d.* from emp e, dept d where e.deptno=d.deptno and e.empno between 1000 and 2000 orqer by e.empno; 


| Id | Operation Name | Rows | Bytes | Cost (%CPU) Time | 
| 0 | SELECT STATEMENT 1 | 117 1 玉 (0) 00: 00: OL | 
| 1 | NESTED LOOPS lL | 117 | 1 (0) 00: 00: 01 | 
| | NESTED LOOPS | | 117 1 1 (0 00: 00: 01 | 
| 3 1 TABLE ACCESS BY INDEX ROWID 

EMP | | 87 | 0 《0 { OQ+ oo0s Ot 1 
I* 41| INDEX RANGE SCAN PK EMP | | | 0 (0) 00: 00: 01 | 
[| INDEX UNIQUE SCAN PK DEPT | 11 | 0 (0) 00: 00: 01 | 
| 6 | TABLE ACCESS BY INDEX ROWID 

DEPT 1 | 30 1 下 (0) 00: .002 0T 1 


人 和 句 有 排序 需求 ， 但 是 在 执行 计划 中 并 没有 排序 动作 。 


SQL> select e.*, d.* from emp 


e, dept d where e. 


原因 就 在 于 使 用 了 索引 范围 扫描 。 在 外 部 表 EMP 的 扫描 中 ， 使 用 了 索引 范围 扫描 ， 因 此 外 层 循 环 返回 的 是 有 序 结果 。 按 照 此 有 序 结 果 ， 再 进行 内 层 循环 ， 其 获取 的 结果 作 


deptno=d.deptno and e.empno between 1000 and 2000 order by d.deptno; 


0 | SELECT STATEMENT | 11 | 2 《50) 00: 00: 01 1 
1 | SORT ORDER BY 1 | | 2 《50) 00: 00: 01 | 
2 1 NESTED LOOPS | | 工业 了 1 (0) 00: 00: Ot | 
3. | NESTED LOOPS | 二 省 17 和 (0) 00: 00: 01 | 
4 | TABLE ACCESS BY INDEX ROWID 
EMP | | 87 | 0 (0) 00: 002 0T 1 
二 INDEX RANGE SCAN| PK EMP | | | 0 (0) 00: .002 OL ] 
0 INDEX UNIQUE SCAN| PK DEPT | 二 全 | 0 (0) 00: 00: 01 | 
7 1 TABLE ACCESS BY INDEX ROWID 
DEPT || | | 


除了 上 述 问题 外 ， 反 转 索 引 也 需要 注意 。 在 范围 扫描 中 ， 是 不 能 使 用 反 转 索引 的 。 
3. 索 引 全 扫描 


索引 全 扫描 跟 字 面 上 的 含义 不 同 ， 它 不 是 指 扫描 索引 的 全 部 节点 块 ， 而 是 指 索引 
在 前 后 指针 ， 分 别 指向 之 前 、 之 后 的 叶子 节点 ， 整 个 形成 了 一 个 双向 链表 。 
扫描 后 的 结果 是 有 序 的， 可 避免 排序 动作 。 


其 发 生 条 件 是 ， 在 至 少 有 一 个 索引 列 被 赋予 了 查询 条 件 的 情况 下 ， 有 可 能 
使 没有 为 索引 赋予 查询 条 件 ， 该 扫描 方式 也 有 可 能 被 选择 执行 。 


“ 查询 语句 所 涉及 的 所 有 列 都 存在 于 索引 中 。 


“ 索引 列 中 至 少 存在 一 个 NOT NULL 列 。 


因此 ， 找 到 一 个 叶 块 后 ， 后 面 只 需要 通过 单个 /O， 顺 序 读 取 每 一 个 叶 块 即 可 。 同 时 ， 


因为 这 种 索引 只 能 


于 精确 键 匹 配 查找 。 


的 全 部 叶 块 。 在 具体 实现 上 ，Oracle 会 从 根 节点 开始 ， 通 过 分 支 节点 找到 第 一 个 叶 块 。 因 


因为 这 种 方式 是 依据 索引 顺序 访问 的 ， 


为 在 B 树 索引 中 ， 叶 子 节点 存 
因此 


索引 全 扫描 ， 也 就 是 说 赋予 查询 条 件 的 索引 列 并 不 一 定 是 索引 的 第 一 列 〈 即 前 导 列 ) 。 在 满足 下 面 两 个 条 件 的 情况 下 ， 即 


在 满足 上 面 两 种 条 件 的 情况 下 ， 可 以 直接 从 索引 中 读 取 数 据 ， 而 不 需要 从 表 中 读 取 数 据 。 如 果 在 索引 列 中 连 一 个 NOT NULL 列 都 不 存在 ， 在 最 坏 的 情况 下 ， 某 个 索引 列 的 所 有 值 全 部 为 NULL， 则 此 时 索 
引 列 有 可 能 没有 被 存储 在 索引 中 ， 这 就 使 得 索引 中 的 行 数 与 表 中 的 行 数 不 一 致 ， 从 而 导致 无 法 从 索引 中 读 取 数 据 。 


SQL> create table t objects as select * from dba objects; 

Table created. 

SQL> alter table t objects modify owner not null; 

Table altered. 

SQL> create index idx owner name on t objects (owner, object name) ; 
Index created. a 


SQL> select owner, object name from t objects order by owner, object name; 


| Bytes | Cost (%CPU) 


| Time 


| 0 | SELECT STATEMENT 
| | 89851 | 
INDEX FULL SCAN 


7282K| 525 (1) 


| 1 


| 00: 00: 07 | 


| IDX OWNER NAME | 89851 | 7282KI 525 《17 1 002 0902 07 1 


/* 语 句 查 看 的 数据 都 在 索引 结构 中 ， 因 此 通过 索引 全 扫描 ， 可 以 得 到 全 部 数据 。 虽 然 在 语句 中 有 排序 的 需求 ， 但 因为 全 扫描 后 的 结果 是 有 序 的 ， 因 此 不 需要 单独 的 排序 
大 


下 面 我 们 来 看 一 个 非常 经 典 的 问题 一 一 MAX/MIN。 


SQL> select min (object id) , max (object id) 


from t_objects; 


1 Operation | Name | 
0 SELECT STATEMENT | | 
SORT AGGREGATE | ] 
2 TABLE ACCESS FULL| T OBJECTS | 


SQL> select min (object id) from t objects union all select max (object id) 


SELECT STATEMENT | | 
UNION-ALL | | 
SORT AGGREGATE 
INDEX FULL SCAN 

SORT AGGREGATE 
INDEX FULL SCAN 


| | 
(MIN/MAX) | IDX OBJECT ID | 


| 
(MIN/MAX) 


IDX OBJECT ID | 


询 中 。 此 时 的 执行 计划 为 “INDEX FULL SCAN (MIN/MAX) 


/* 我 们 的 需求 是 访问 索引 列 的 最 大 值 、 最 小 值 ， 优 化 器 给 出 的 执行 计划 却 是 全 表 扫 描 。 显 然 这 不 是 一 个 优质 的 执行 计划 ， 从 简单 分 析 可 知 ， 最 大 值 、 最 小 值 实际 对 应 的 就 是 索引 叶子 节点 的 双向 链表 中 左右 端的 数据 。 但 优化 器 无 法 : 


from t objects; 


。 这 是 一 种 特殊 的 索引 全 扫描 。 它 按照 全 扫描 的 方式 扫描 部 分 数据 ， 快 速 得 到 结果 


4. 索 引 快 速 全 扫描 


索引 快速 全 扫描 ， 是 类 似 于 全 表 扫 描 的 一 种 处 理 方式 。 它 一 次 读 取 多 个 数据 块 ， 读 取 的 对 象 也 不 


限于 叶子 块 ， 还 包含 分 支 块 (当然 也 包括 根 节点 ) ， 但 是 在 处 理 中 会 忽略 这 些 块 。 由 于 是 一 次 读 取 多 个 


块 ， 且 没 按照 索引 顺序 读 取 ， 因 此 查询 后 的 结果 是 无 序 的 。 这 种 方式 可 以 使 用 多 块 读 功 能 ， 也 可 以 使 
是 该 方式 与 索引 全 扫描 之 间 的 主要 区 别 。 


并 行 读 入 ， 以 便 获 得 最 大 吞吐 量 与 缩短 执行 时 间 。 索 引 快 速 全 扫描 每 次 VO 读 取 的 是 多 个 数据 块 ， 这 也 


常见 的 使 用 快速 全 扫描 的 情形 是 ， 
外 ， 这 种 形式 返回 的 结果 集 是 无 序 的 。 


查询 需 
同样 ， 也 需要 满足 索引 列 中 至 少 一 个 NOT NULL 列 。 


SQL> create index idx object id on tl (object id) ; 

Index created. I 及 

SQL> insert into tl select * from dba objects where rownum<10001; 
10000 rows created. 

SQL> commit; 

Commit complete. 

SQL> alter table tl modify (object id not nul1) ; 
Table altered. 

SQL> exec dbms stats.gather table stats ('hf', 't1', 
PL/SQL procedure successfully completed. 

SQL> select object id from tl where rownum<11; 


cascade=>true) ; 


i Operation | Name | 
0 SELECT STATEMENT | | 
吉 :上 COUNT STOPKEY | 
2 INDEX FAST FULL SCAN| IDX OBJECT ID | 


// 默 认 走 的 索引 快速 全 扫描 


SQL> select /*+ index (tl idx object _ id) */ object id from tl] where rownum<11; 


Id Operation | Name | 
0 SELECT STATEMENT | |! 
本 COUNT STOPKEY | | 
2 INDEX FULL SCAN| IDX OBJECT ID | 


// 指 定 索引 后 ， 反 而 走 的 是 索引 全 扫描 
SQL> select /*+ index ffs (tl idx object id) 


*/ object id from tl1 where ownum<11 or 


SELECT STATEMENT | | 
SORT ORDER BY | | 
COUNT STOPKEY | | 

| 


// 指 定 使 用 索引 快速 全 扫描 。 由 于 索引 快速 全 扫描 返回 的 结果 是 无 序 的 ， 因 此 还 需要 单独 排序 


select object id from tl where rownum<11 order by object id; 
Id Operation | Name | 
0 SELECT STATEMENT | | 
和 COUNT STOPKEY | | 
< INDEX FULL SCAN| IDX OBJECT ID | 


RT 不 使 用 提示 ， 走 的 索引 全 扫描 。 因 为 这 种 情况 下 ， 排 序 的 成 本 要 大 于 使 用 索引 快速 全 扫描 因为 


下 面 重点 对 比索 引 全 扫描 和 索引 快速 全 扫描 ， 
FULL SCAN 和 其 他 索引 扫描 不 同 ， 它 不 会 从 树 的 根 节点 开始 读 取 ， 而 是 直接 扫描 所 有 叶子 节点 ; 


的 列 都 在 索引 中 ， 这 时 通过 索引 扫描 即 可 ， 无 须 回 表 查 。 这 也 是 一 种 常见 的 优化 手段 ， 即 向 索引 中 添加 字段 ， 目 的 就 是 


索引 快速 全 扫描 替代 回 表 查 。 此 


der by object id; 


多 块 读 带 来 的 收益 


因为 很 多 人 会 将 其 搞 混 。 索 引 快速 全 扫描 和 全 表 扫描 类 似 ， 一 次 读 取 db _file_multiblock_read_count 个 数据 块 来 扫描 所 有 索引 的 叶子 节点 。INDEX FAST 
也 不 会 一 次 读 取 一 个 数据 块 ， 而 是 一 次 读 取 db file multiblock_read_count 个 数据 块 。INDEX FAST FULL 


SCAN 会 引起 db file scattered read 事 件 。 在 某 些 情况 下 ， 如 db file_ mu 
不 同 ， 它 是 一 种 索引 扫描 ， 按 照 B-Tree 的 查找 法 从 树 的 根 节 点 开始 扫描 ， 遍 历 整 棵 树 ， 并 一 次 读 


5. 索 引 跳 跃 扫描 


tiblock_read_count 值 过 小 、 强 制 使 
取 一 个 数据 块 。 它 会 引起 db file sequential read 导 


索引 扫描 时 ， 会 发 生 INDEX FULL SCAN。INDEX FULL SCAN 和 INDEX FAST FULL SCAN 


件 。 


索引 跳跃 扫描 是 一 个 比较 “鸡肋 ”的 功能 ， 很 多 数据 库 不 支持 这 种 扫描 方式 。 即 使 在 Oracle 中 ， 也 建议 若 库 中 出 现 了 索引 跳跃 扫描 ， 应 考虑 避免 。 这 种 扫描 方式 是 指 ， 在 索引 中 有 多 个 列 ， 且 第 一 个 列 
的 重复 值 不 多 ， 此 时 如 果 只 访问 第 二 个 列 ， 则 Oracle 可 能 会 采取 索引 跳跃 扫描 。 其 原理 相当 于 执行 了 多 次 范围 扫描 ， 并 将 结果 合并 返回 。 可 以 通过 _optimizer_skip_scan_enabled 参 数 来 启用 、 禁 用 索引 跳 


路 扫描 。 也 可 以 使 


索引 跳跃 扫描 。 


INDEX_Sss 来 引导 优化 器 使 有 


下 面 通过 一 个 示例 对 索引 跳跃 扫描 进行 说 明 。 


SQL> create table t as select 1 id, object name from dba objects; 
Table created. 

SQL> insert into t select 2 , object name from dba objects; 

86297 rows created. 

SQL> insert into t select 3 , object name from dba objects; 

86297 rows created. 下 本 

SQL> insert into t select 4 , object name from dba objects; 

86297 rows created. 
SQL> commit; 

Commit complete. 

SQL> create index idx t on t (id, object name) ; 
Index created. 

SQL> exec dbms_stats.gather table stats (user, 't', cascade=>true) ; 


PL/SQL Procedure successfully completed. 
SQL> select * from 七 where object name="'T'; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT | | | 140 | 生 (0) | 00: 00: 01 | 
I* 1 | INDEX SKIP SCAN | IDX T | 5 1 140 | 5 (0) | 00: 00: 01 | 


/* 对 于 索引 IDX_T 来 说 ， 第 一 个 字段 ID 的 重复 值 不 多 ， 当 查询 只 引用 了 后 面 字段 OBJECT _ NAME 时 ， 优 化 器 考虑 使 用 了 索引 跳跃 扫描 方式 


11.3 ”位 图 索引 访问 路 径 


位 图 索引 ， 是 Oracle 数 据 库 中 除了 B 树 索引 外 ， 另 外 一 种 支持 的 索引 。 这 种 索引 的 存储 结构 是 按照 “索引 键 值 + 对 应 ROWID 下 限 + 对 应 ROWID 上 限 + 位 图 段 ”形式 组 成 的 。 其 中 位 图 段 是 按照 压缩 方 


式 存 储 的， 内 容 就 是 一 连 串 0 和 1。 对 应 位 ROWID 是 这 个 索引 键 值 就 是 1， 否 则 就 是 0。 


值 较 少 的 话 ， 存 储 空间 会 占 


由 上 述 位 图 索引 的 存储 结构 可 见 ， 位 图 索引 字段 的 


很 小 ， 也 就 是 说 这 是 一 种 密度 较 高 的 存储 格式 。 而 且 这 种 方式 还 支持 类 似 AND、OR 等 逻辑 条 件 的 查询 ， 这 种 方式 


通过 BIT 的 与 、 或 操作 很 容易 实现 。 


Oracle 支 持 多 种 位 图 操作 ， 如 表 11-1 所 示 。 


表 11-1 Oracle 支 持 的 位 图 操作 


Option Det.option 说 明 

BITMAP CONVERSION TO ROWIDS 为 了 读 取 表 中 的 数据 而 将 位 图 转换 为 ROWID 

FROM ROWIDS ROWID 转换 为 位 图 

COUNT 不 需要 实际 列 值 而 只 读 取 符合 条 件 的 ROWID 的 个 数 
BITMAP INDEX SINGLE VALUE 在 索引 块 中 与 一 个 键 值 相对 应 的 位 图 的 查询 

RANGE SCAN 与 一 个 键 值 相对 应 的 多 个 位 图 的 查询 

FULL SCAN 在 没有 提供 开始 /结束 值 的 情况 下 位 图 整体 扫描 
BITMAP MERGE 对 范围 扫描 所 获得 的 几 个 位 图 进行 合并 
BITMAP MINUS 否定 型 运算 或 者 集合 差 运算 
BITMAP OR 对 两 个 位 图 集合 执行 或 运算 
BITMAP AND 对 两 个 位 图 集合 执行 与 运算 

对 于 从 一 个 表 中 获得 的 行使 用 指定 的 位 图 索引 进行 连续 扫 
BITMAP KEY ITERATION 描 ， 直 到 找到 复合 条 件 的 位 图 的 操作 。 这 是 在 星 型 连接 中 所 
表现 出 来 的 类 型 


下 面 对 主 要 操作 进行 说 明 。 


1. 位 图 索引 单 键 扫描 


单 键 扫 描 ， 顾 名 思 义 就 是 根据 位 图 索引 中 的 一 个 索引 键 值 的 匹配 访问 ， 可 类 比 B 树 索引 的 单 键 扫描 。 可 以 使 


“=” 或 IN 运算 符 实现 。 


SQL> create table t users as select * from dba users; 
Table created. 

SQL> select distinct account status from t users; 
ACCOUNT STATUS 


OPEN 

EXPIRED & LOCKED 

SQL> create bitmap index idx status on t users (account status) ; 
Index created. 

SQL> select * from t users where account status='OPEN'; 


| 0 | SELECT STATEMENT | 4 1 
| 1 | TABLE ACCESS BY INDEX ROWID | T_USERS | 4 1 
| 2 1 BITMAP CONVERSION TO ROWIDS| | 
| 二 3] BITMAP INDEX SINGLE VALUE | IDX_ STATUS | | 


/* 注 意 ID=3 的 步骤 ， 名 称 为 BITMAP INDEX SINGLE VALUE， 索 引 单 键 扫描 。 上 面 一 步 则 为 BITMAP CONVERSION TO ROWID， 即 将 位 图 运算 结果 转化 为 ROWID， 然 后 再 根据 ROWID 访 问 表 
A 


2. 位 图 索引 范围 


扫描 


位 图 索引 范围 扫描 是 类 比 B 树 索引 的 范 
询 多 个 键 值 的 位 图 。 在 范围 比较 的 查询 条 件 与 其 他 查询 条 件 一 起 被 使 


由 扫描 。 在 使 用 BETWEEN、LIKE、>、>=、<、 


<= 运 算 符 的 情况 下 ， 显 示 出 来 的 是 查询 多 个 键 值 的 位 图 执行 计划 ， 在 执行 计划 中 显示 的 RANGE SCAN 指 的 是 查 


的 情况 下 ， 优 化 器 将 制定 首先 合并 范围 扫描 的 位 图 执行 计划 。 


SQL> create table t objects as select * from dba objects; 

Table created. 

SQL> create bitmap index idx obj type on t objects (object type) ; 

Index created. 加 加 

SQL> select * from t objects where object type between 'TYPE' and 'VIEW'; 


SELECT STATEMENT 


| | 
TABLE ACCESS BY INDEX ROWID | T_OBJECTS | 9688 | 
BITMAP CONVERSION TO ROWIDS1 | | 
BITMAP INDEX RANGE SCAN | IDX OBJ TYPE | | 


// 注 意 最 后 出 现 的 关键 字 BITMAP INDEX RANGE SCAN 


3. 位 图 索引 全 扫描 


网 


位 图 索引 全 扫描 是 类 比 B 树 索引 的 索引 全 扫描 。 


SQL> select object type from t objects order by object type; 


| Id | Operation | Name | Rows | 
| 0 | SELECT STATEMENT | | 89851 | 
| 1 | BITMAP CONVERSION TO ROWIDS| | 89851 | 
| 2 | BITMAP INDEX FULL SCAN | IDX OBJ TYPE | | 


/* 注 意 最 后 一 步 的 关键 字 BITMAP INDEX FULL SCRAN。 此 外 ， 不 仅 B 树 索引 返回 的 是 有 序 的 结果 ， 位 图 索引 也 是 有 序 的 结果 


4. 位 图 索引 快速 全 扫描 


[ey 
网 


索引 快速 全 扫描 是 类 比 B 树 索引 的 索引 快速 全 扫描 。 


SQL> select object type from t objects; 


| Id | Operation | Name | Rows | 

| 0 | SELECT STATEMENT 1 | 89851 | 

| 1 1 BITMAP CONVERSION TO ROWIDS | | 89851 | 

| 2 | BITMAP INDEX FAST FULL SCAN| IDX OBJ TYPE | | 

// 注 意 最 后 一 步 的 关键 字 BITMAP INDEX FAST FULL SCAN。 位 图 索引 的 快速 全 扫描 走 的 也 是 多 块 读 取 的 方式 
5. 位 图 按 位 与 


位 图 索引 独 有 的 一 个 特点 是 ， 针 对 两 个 位 图 索引 根据 条 件 可 以 做 逻辑 “与 ”操作 。 在 使 用 AND 连 接 多 个 已 经 创建 了 位 图 索引 的 字段 的 情况 下 ， 数 据 库 会 读 取 各 个 位 图 索引 之 后 再 执行 AND 运 算 。 如 果 在 
AND 连 接 的 查询 条 件 中 有 NOT EQUAL 查 询 条 件 ， 则 要 执行 BITMAP MINUS 运 算 。 这 种 情况 下 ， 根 据 是 否 允 许 为 NULL， 所 显示 的 执行 计划 也 不 同 。 


网 


[ 


SQL> create bitmap index idx obj status on t objects (status) ; 
SQL> select * j s where obj 'STATUS' and status="'VALID'; 


| 0 | SELECT STATEMENT | | 
| 1 1 TABLE ACCESS BY INDEX RONID | T_OBJECTS | 

| 2 1 BITMAP CONVERSION TO RONIDS| 一 | 

| 31 BITMAP AND | | 

lx 4| BITMAP INDEX SINGLE VALUE| IDX OBJ TYPE | 

I* 51 BITMAP INDEX SINGLE VALUE| IDX OBJ STATUS | 

人 根据 两 个 条 件 的 “与 ”操作 ， 最 后 转换 为 位 图 索引 的 “与 ”操作 ， 关 键 字 是 BITMAP RND。 具 体 实现 上 就 是 利用 BIT 的 逻辑 运算 得 到 ， 效 率 很 高 
x 


6. 位 图 按 位 或 


哆 | 


位 图 按 位 “或 ”和 位 图 按 位 “与 ”类 似 。 在 使 用 OR 连接 已 创建 位 图 索引 的 查询 条 件 的 情况 下 ， 各 个 查询 条 件 生成 自身 的 读 取 单位 之 后 ， 再 将 各 个 读 取 单位 的 位 图 进行 OR 运算 。 这 一 点 与 B 树 索引 完全 不 
同 。B 树 索引 在 比较 复杂 的 OR 连接 的 查询 条 件 下 往往 无 法 使 用 ， 但 是 位 图 索引 可 以 。 


SQL> select * from t objects where object type="'STATUS' or status="'VALID'; 


| Id | Operation | Name | 
| 0 | SELECT STATEMENT | | 
| 1 | TABLE ACCESS BY INDEX ROWID | T_ OBJECTS | 
| 部] BITMAP CONVERSION TO ROWIDS| | 
| | BITMAP OR | | 
I* 4 1 BITMAP INDEX SINGLE VALUE| IDX OBJ TYPE | 
[| BITMAP INDEX SINGLE VALUE| IDX OBJ STATUS | 


// 关 键 字 BITMAP OR 


对 BIT 做 集合 减法 。 在 使 用 由 不 等 式 查询 条 件 所 创建 的 位 图 索引 的 情况 下 ， 将 会 执行 BITMAP MINUS 运 算 。 也 就 是 说 从 被 优先 执行 的 位 图 中 减 去 将 不 等 式 视 为 等 式 所 读 取 的 列 值 的 位 图 。 此 时 ， 在 使 有 
不 等 式 的 列 中 有 NOT NULL 和 没有 NOT NULL 约 束 条 件 的 处 理 方 法 有 所 不 同 。 


SQL> select /*+ index (t_objects idx obj status) */ * from t objects where object type='TABLE' and status! ="'VALID'; 


| Id | Operation | Name | 
| 0 | SELECT STATEMENT | | 
| 1 | TABLE ACCESS BY INDEX ROWID | T OBJECTS | 
| 2 | BITMAP CONVERSION TO ROWIDS | | 
| 要 ,| BITMAP MINUS | lL 
| 4 1 BITMAP MINUS | | 
| 车 ”号 | BITMAP INDEX SINGLE VALUE| IDX OBJ TYPE | 
[| BITMAP INDEX SINGLE VALUE | IDX_ OBJ_STATUS 1 
| | BITMAP INDEX SINGLE VALUE | IDX OBJ STATUS | 


8.NULL 判 断 


在 位 图 索引 中 ， 如 果 查 询 条 件 列 使 用 的 是 “IS NULL” 或 者 “IS NOT NULL” 比 较 运 算 符 ， 则 将 NULL 与 其 他 一 般 的 值 等 同 对 待 ， 同 样 可 以 使 用 位 
储 NULL 值 ， 而 位 图 索引 是 将 NULL 用 和 其 他 一 般 值 同样 的 方式 进行 存储 的 。 


网 


网 


索引 。 这 一 点 要 和 B 树 索引 区 别 开 来 。B 树 索引 不 存 


SQL> select * from t objects where status is null; 


| 0 | SELECT STATEMENT | 
| 1 | TABLE ACCESS BY INDEX ROWID | T_OBJECTS | 


| BITMAP CONVERSION TO ROWIDS| : 
| BITMAP INDEX SINGLE VALUE | IDX OBJ STATUS | 


// 判 断 处 理 跟 普 通 的 单 值 是 一 样 的 


后 ， 


9.B 树 与 位 图 索引 转换 


从 上 面 示例 中 可 见 ， 位 图 索引 是 可 以 转换 为 ROWID 的 ，ROWID 也 可 以 转换 为 位 此 可 将 将 B 树 索引 转换 为 位 图 后 再 按照 位 图 进行 运算 。 执 行 这 种 转换 ， 是 在 优化 器 判断 出 将 B 树 索引 转换 为 位 
可 以 缩减 查询 范围 才 会 进行 的 。 当 然 这 里 有 个 成 本 问题 ， 如 果 将 要 被 转换 的 位 图 索引 具有 很 大 的 查询 范围 ， 则 在 转换 的 过 程 中 不 仅 需 要 的 代价 很 大 ， 而 且 即 使 通过 位 图 运算 实现 了 两 个 B 树 索引 的 合并 也 


网 


网 


不 一 定 能 缩小 查询 范围 ， 所 以 要 视 具 体 问题 而 定 。 


SQL> create table 七 objects as select * from dba objects; 

Table created. 

SQL> create index idx status on t objects (status) ; 

Index created. 

SQL> create index idx owner on t objects (owner) ; 

Index created. 出 | He 

SQL> select * from t objects where status='INVALID' and owner='HF'; 


0 SELECT STATEMENT | | 
二 TABLE ACCESS BY INDEX ROWID| T OBJECTS | 
INDEX RANGE SCAN | IDX OWNER | 


， 挑 选 了 其 中 


0 | SELECT STATEMENT | 
二 TABLE ACCESS BY INDEX RONID | 
2 BITMAP CONVERSION TO ROWIDS 上 
二 BITMAP AND | 
4 BITMAP CONVERSION FROM ROWIDS| | 
5 | 
6 | 
7 | 


INDEX RANGE SCAN | IDX_ OWNER 
BITMAP CONVERSION FROM ROWIDS| 
INDEX RANGE SCAN | IDX_STRATUS 


/* 通 过 一 个 提示 的 引入 ， 优 化 器 选择 了 转换 。 其 方式 是 在 ID=5、7 步 又 ， 执 行 了 B 树 索引 的 范围 扫描 ， 然 后 转换 为 RONID。 在 ID=3 的 步骤 ， 将 得 到 的 结果 集 做 了 位 图 与 操作 ; 随后 在 ID=2 的 步骤 将 结果 集 又 转换 为 RONTD， 再 通过 ROW 


uy 


业 ] 


4 ”其 他 访问 路 径 


1. 索 引 特 殊 访问 路 径 


(1) 索引 合并 (INDEX MERGE) 


索引 合并 是 指 Oracle 从 多 个 索引 中 获取 匹配 记录 ， 然 后 合并 这 些 结果 集 。 一 般 来 阅 ， 索 引 合并 并 不 是 一 种 太 高 效 的 解决 方案 ， 往 往 不 如 组 合 索引 效率 高 。 此 外 ， 位 图 索引 的 合并 效率 要 高 于 B 树 索引 ， 


这 了 


要 是 由 位 图 索引 特殊 的 结构 造成 的 。 此 外 ， 还 存在 一 种 特殊 情况 。 就 是 对 两 个 B 树 索引 进行 合并 ， 优 化 器 可 能 可 能 会 将 B 树 索引 转化 为 位 图 ， 合 并 后 再 转换 为 B 树 。 当 然 这 种 策略 取决 于 查询 范围 ， 如 果 


过 大 的 话 ， 转 换 类 型 也 是 一 个 很 大 的 开销 。 


据 。 


只 有 当 索 引 合并 具有 相似 的 离散 度 时 才 比 较 有 效 ， 当 索引 离散 度 相差 较 大 时 使 用 索引 合并 的 方法 会 影响 执行 效率 。 如 果 两 者 相差 悬 斧 ， 往 往 是 一 个 较 好 的 索引 负责 读 取 数据 ， 另 外 的 索引 负责 检验 数 
在 老 版 本 的 Oracle 中 ， 可 以 通过 指定 AND_EQUAL 提 示 引 导 优化 器 按照 索引 合并 的 方式 执行 。 


人 们 往往 会 面临 一 个 选择 ， 使 用 组 合 索 引 好 ， 还 是 建立 单 键 索引 ， 然 后 通过 索引 合并 效果 好 ? 对 于 索引 合并 来 说 ， 具 有 相同 ROWID 的 索引 行 才能 进行 合并 ， 为 了 查找 相同 的 ROWID 就 需要 在 两 个 索引 


之 间 往 返 ， 而 在 此 过 程 中 ， 很 大 一 部 分 是 无 用 功 。 组 合 索引 则 不 同 ， 它 是 按照 索引 列 和 ROWID 对 所 有 索引 行进 行 排序 ， 往 往 效率 更 高 。 


下 面 看 一 个 相关 的 示例 。 


SQL> create table t objects as select * from dba objects; 

Table created. 

SQL> create index idx obj type on t objects (object type) ; 

Index created. 

SQL> create index idx obj owner on t objects (owner) ; 

Index created. 

SQL> select * from t objects where owner='SYS' and object type="'VIEW'; 


| Id | Operation | Name | Rows | 
| 0 | SELECT STATEMENT | | 6745 | 
| 1 | TABLE ACCESS BY INDEX ROWID | T_OBJECTS | 6745 | 
| Ar | BITMAP CONVERSION TO ROWIDS | | | 
| 有 | BITMAP AND | | | 
| 4 1 BITMAP CONVERSION FROM ROWIDS| | | 
性 = 各 INDEX RANGE SCAN | IDX OBJ TYPE | | 
| 6 | BITMAP CONVERSION FROM ROWIDS| ee | | 
[| INDEX RANGE SCAN | IDx OBJ OWNER | | 
a 7 步骤 中 ， 范 围 读 取 了 B 树 索引 ， 然 后 根据 获得 的 RONID 转 换 为 BITMAP。 对 获得 的 BITMRAP 进 行 了 逻辑 与 操作 后 ， 再 转换 为 ROWID。 最 后 根据 RONID 回 表 查 询 
四 


(2) 索引 关联 (INDEX JOIN) 


索引 关联 是 指 表 中 存在 多 个 索引 ， 通 过 类 似 表 间 关联 的 哈 希 连接 的 方式 对 索引 进行 连接 。 由 于 哈 希 连接 只 能 通过 ROWID 来 实现 索引 连接 ， 所 以 只 要 能 够 从 索引 中 获得 ROWID 并 将 其 提供 给 哈 希 连接 就 


可 以 实现 索引 连接 的 目的 了 。 只 要 在 合适 的 列 (满足 整个 查询 的 列 ) 上 建立 索引 ， 就 可 以 确保 优化 器 将 索引 连接 作为 可 选项 之 一 。 相 对 于 索引 快速 全 扫描 ， 索 引 关联 扫描 可 以 通过 多 个 索引 满足 查询 需求 。 


联 。 


系统 有 一 个 隐 含 参数 index join_enabled， 其 默认 值 是 true， 即 允许 使 用 索引 连接 。 当 然 是 否 选择 索引 关联 还 是 要 取决 于 成 本 的 计算 。 此 外 ， 还 可 以 通过 INDEX_ JOIN 提示 来 引导 优化 器 使 用 索引 关 


下 面 看 一 个 相关 示例 。 


SQL> create index idx obj type on t objects (object type) ; 
Index created. 本 加 全 
SQL> create index idx obj owner on t objects (owner) ; 
Index created. 

SQL> select owner, object type from t objects where owne: 


Ro 


d object type= 'VIEW'; 


| 0 | SELECT STATEMENT 


| | 6745 | 184K| 128 (0) | 00: 00: 02 | 
I* 1 | VIEW | index$ join$ 001 | 6745 | 184K| 128 (0) | 00: 00: 02 | 


I* 2 | HASH JoIN | 1 1 1 | 1 
[Ee | INDEX RANGE SCAN 

| IDX OBJ_ TYPE | 6745 | 184K| 28 (0) | 00: 00: 01 
I* 4 1 INDEX RANGE SCAN 

| IDX_OBJ_ONNER | 6745 | 184K| 100 (0) | 00: 00: 02 


全 和 全 人 对 应 于 两 个 索引 ， 这 两 个 索引 分 别 先 做 了 一 个 哈 希 连接 ， 从 ID= 


的 视图 indexS$_ join$_001 中 可 以 看 到 索引 连接 的 结果 。 因 为 最 终 的 查询 字段 都 在 索引 中 ， 因 此 只 通过 索引 查询 就 可 以 得 到 数据 


2. 聚 艇 访问 路 径 


聚 艇 是 一 个 或 多 个 表 的 物理 组 合 ， 每 个 表 有 一 个 或 多 个 共同 列 。 聚 艇 作为 一 个 结构 ， 使 不 同 表 中 的 数 


居 在 同一 数据 块 中 存储 。 聚 篮 键 连接 每 个 表 中 的 行 ， 并 将 其 存放 在 一 起 。 聚 艇 根据 聚 禾 键 预先 连接 


数据 ， 从 而 提高 性 能 ， 并 减少 存储 要 求 。 只 对 所 有 具有 相同 键 值 的 行 存 储 一 个 聚 徐 。 使 用 聚 篮 的 主要 目的 就 是 提高 聚 禾 


根据 方式 的 不 同 可 分 为 索引 聚 艇 和 散 列 聚 徐 。 对 于 聚 篮 的 访问 ， 有 其 特殊 的 访问 路 径 ， 如 下 所 示 ， 


子 。 聚 禾 


子 直接 反映 我 们 所 要 读 取 的 数据 在 多 大 程度 上 被 集中 存储 在 一 起 。 聚 篮 


因 这 部 分 用 得 很 少 ， 就 不 展开 说 明了 。 


TABLE ACCESS (CLUSTER) OF 'XXX' 
TABLE ACCESS (HASH) OF 'XXX' 


3.COUNT (STOPKEY) 


COUNT (STOPKEY) 计划 是 指 在 查询 语句 的 查询 条 件 中 使 用 ROWNUM 时 所 显示 出 来 的 执 和 


了 计划， 看 下 面 的 示例 。 


SQL> select * from t objects where rownum<10; 


0 1 LECT STATEMENT 最 (0) | 00: 00: 01 
安生 溃 OUNT STOPKEY | 
-0 


| | 
TABLE ACCESS FULL| T_OBJPECTS 2 (0) | 00: 00: 01 


4.INLIST 


INLIST 是 一 种 在 多 值 比较 中 经 常 产生 的 执行 计划 。 在 INLIST 之 下 的 查询 过 程 被 重复 执行 多 次 ， 


执行 次 数 由 IN 的 个 数 决 定 。 看 下 面 的 示例 。 


SQL> create index idx object id on t objects (object id) ; 
SQL> select * from t objects where object id in (1 EF 


Id Operation Name 
0 SELECT STATEMENT 5 
INLIST ITERATOR 
2 TABLE ACCESS BY INDEX ROWID| T OBJECTS 了 导 
INDEX RANGE SCAN IDx OBJECT ID Es 


// 注 意 上 述 比 较 的 重复 次 数 ， 也 就 是 比较 OBJECT_ID 的 次 数 ， We 上 表 长 度 决定 的 
SQL> select * from t objects where object - OF object i or object id=3; 


0 | SELECT STATEMENT | 

I INLIST ITERATOR 

2 TABLE ACCESS BY INDEX ROWID| T OBJECTS 3 
三 INDEX RANGE SCAN IDX OBJECT ID 3 


// 这 是 另外 一 种 情况 ， 虽 然 没 有 指定 jnlist， 但 优化 器 此 时 将 OR 条 件 转 换 为 jn1ist 处 理 


5. 集 合 类 


集合 类 是 一 系列 跟 集合 操作 有 关系 的 执行 计划 ， 常 见 的 有 并 集 、 交 集 、 差 集 等 。 看 下 面 的 示例 。 


SQL> create table t_objl as select * from t objects; 
SQL> create table t_obj2 as Select * from t objects; 
SQL> select * from t objl union all select * from t obj2; 


Td Operation | Name | Rows | 
0 SELECT STATEMENT | | | 
赤 UNION-ALL 1 
2 TABLE ACCESS FULL| T OBJ1 | 81765 | 
3 TABLE ACCESS FULL| T OBJ2 | 115K| 


// 这 是 并 集 的 一 个 操作 。 需 


注意 的 是 ， 这 里 使 用 了 UNION ALL， 那 如 果 是 UNION 又 会 如 何 呢 ? 
SQL> select * from t objl union select * from t_obj2; 


Td Operation Name Rows 
0 SELECT STATEMENT 197K 
二 SORT UNIQUE 197K 
2 UNION-ALL 
3 TABLE ACCESS FULL| T OBJ1 81765 
4 TABLE ACCESS FULL| T_OBJ2 115K 


// 又 多 了 一 步 去 重 的 动作 
SQL> select * from t objl intersect select * from t obj2; 


Id Operation Name Rows 
0 SELECT STATEMENT 81765 
1 INTERSECTION 
人 SORT UNIQUE 81765 
3 TABLE ACCESS FULL| T OBJ1 81765 
4 SORT UNIQUE 及 115K 
与 TABLE ACCESS FULL| T_OBJ2 115K 


// 这 是 一 个 交集 的 操作 
SQL> select * from t objl minus select * from t obj2; 


Id Operation Name Rows 
0 SELECT STATEMENT 81765 
1 MINUS 
世 SORT UNIQUE 81765 
3 TABLE ACCESS FULL| T OBJ1 81765 
4 SORT UNIQUE 115K 
5 TABLE ACCESS FULL| T_OBJ2 115K 


// 这 是 一 个 差 集 的 操作 


第 12 章 ” 表 间 关联 


表 间 关联 是 指 在 一 个 SQL 语句 中 通过 表 与 表 之 间 的 关联 ， 从 一 个 或 多 个 表 中 检索 出 相关 的 数据 。 连 接 是 通过 SQL 语句 中 FROM 从 名 的 多 个 表 名 及 WHERE 从 句 里 定义 的 表 之 间 的 连接 条 件 来 实现 的 。 如 果 
一 个 SQL 语 句 的 关联 表 超过 两 个 ， 那 么 连接 的 顺序 如 何 呢 ? ORACLE 首 先 连接 其 中 的 两 个 表 ， 产 生 一 个 结果 集 ; 然后 将 产生 的 结果 集 与 下 一 个 表 再 进行 关联 ;重复 上 述 过 程 ， 直 到 所 有 的 表 都 连接 完成 ， 最 
后 产生 所 需 的 数据 。 


下 面 我 们 先 来 看 看 Oracle 支 持 的 表 间 关联 关系 。 


12.1 关联 关系 


Oracle 的 关联 关系 有 内 连接 、 左 连接 、 右 连接 、 全 连接 。 下 面 通过 一 个 示例 来 看 看 它们 之 间 的 区 别 。 


回 


SQL> create table tl ( a int, b varchar2 (10) ) ; 
insert into tl values (1, 'al'); 

insert into tl values (2, 'a2'); 

insert into tl values (3, 'a3'); 

Commit; 

SQL> create table t2 ( a int, b varchar2 (10) ) ; 
insert into t2 values (2, 'b2'); 

insert into t2 values (3, 'b3'); 

insert into t2 values (4, 'b4'); 

commit; 

SQL> select * from 七 1; 


节 而 


AB 


4 b4 
// 情 况 1 一 一 内 连接 (INNER JOIN) 
SQL> select tl1.*, t2.* 


2 from tl 
3 inner join t2 on tl1.a=t2.a; 
AB AB 
2 a2 2 b2 
3 a3 3 b3 
// 情 况 2 一 一 左 连接 (LEFT JOIN) 
SQL> select tl1.*, t2.* 
2 from tl 
3 left join t2 on t1.a=t2.a; 
AB AB 
2 a2 2 b2 
3 a3 3 b3 
1 al 
// 情 况 3 一 一 右 连 接 (RIGHT JOIN) 
SQL> select tl1.*, t2.* 
2 from tl 
3 right join t2 on t1.a=t2.a; 
AB AB 
2 a2 2 b2 
3 a3 3 3 
4 b4 
// 情 况 4 一 全 连接 (FULL JOIN) 
SQL> select tl1.*, t2.* 
2 from tl 
3 full join t2 on tl1.a=t2.a; 
AB AB 
2 a2 2 b2 
3 a3 3 b3 
4 b4 
1 al 


// 情 况 5 一 一 笛 卡 儿 积 (CROSS JOIN) 
SOL> select tl1.*, t2.* 

2 from tl 

3 Crose Join t2; 


从 上 面 的 示例 中 ， 可 以 看 出 不 同 连 接 方式 的 区 别 。 在 Oracle 中 支持 多 种 关联 写法 ， 一 种 是 标准 写法 ， 一 种 是 Oracle 自 己 的 独 有 写法 。 先 来 看 看 标准 写法 : 


SELECT tablel .column, table2.colum 

FROM tablel 

[CROSS JOIN table2] 

[NATIONAL JOIN table2] 

[JOIN table2 USING (column name) ] 

[JOIN table2 ON (tablel.colum=table2.column) ] 

[LEFT|RIGHT|FULL OUTER JOIN table2 ON (tablel.column=table2.column) ]; 


其 中 : 
:CROSS JOIN: 无 连接 条 件 ， 返 回 的 是 笛 卡 儿 积 。 
`“ NATIONAL JOIN: 将 两 个 表 中 同名 的 列 作为 连接 条 件 。 如 果 两 个 表 的 同名 列 的 数据 类 型 不 同 ， 则 会 报错 。 


“ JOINhttp://www.hzcourse.com/resource/readBook?path=/openresources/teach_ebook/uncompressed/15654/OEBPS/Text/...USING: 如 果 用 列 名 连接 且 同 名 列 多 于 一 个 ， 则 用 USING 子 句 指定 列 名 。 需 要 
注意 的 是 ， 如 果 USING 使 用 的 列 也 在 SELECT 部 分 出 现 ， 不 能 指定 表 限 定 符 ， 直 接 写 列 名 即 可 。 


* JOINhttp://www.hzcourse.com/resource/readBook?path=/openresources/teach_ebook/uncompressed/15654/OEBPS/Text/...ON (http://www.hzcourse.com/resource/readBook? 
path=/openresources/teach_ebook/uncompressed/15654/OEBPS/Text/...) : 在 ON 子 句 部 分 指定 连接 条 件 。 


:OUTER JOIN: 外 连接 。 


再 看 看 Oracle 自 有 的 书写 方式 ， 并 对 比 标准 写法 。 


(1) 内 连接 : 


// 标 准 写法 

select tablel .column, table2.colum 

from tablel 

inner join table2 on (tablel.column=table2.column) ; 
// 专 有 写法 

select tablel .column, table2.colum 

from tablel, table2 

where tablel .column=table2.column; 


(2) 左 连 接 : 


// 标 准 写法 

select tablel .column, table2.colum 
from tablel 

left join table2 on (tablel.column=table2.column) ; 
// 专 有 写法 

select tablel .column, table2.colum 
from tablel, table2 

where tablel .column=table2.column (+) ; 


优先 提取 左 侧 表 记录 。 如 果 右 侧 表 有 匹配 记录 则 显示 ; 否则 显示 为 空 


(3) 右 连 接 : 


// 标 准 写法 

select tablel .column, table2.colum 

from tablel 

right join table2 on (tablel.column=table2.column) ; 
// 专 有 写法 

select tablel .column, table2.colum 

from tablel, table2 

where tablel.colum (+) =table2.column; 


// 优 先 提取 右 侧 表 记 录 。 如 果 左 侧 表 有 匹配 记录 则 显示 ; 否则 显示 为 空 
(4) 全 连接 : 

// 标 准 写法 

select tablel .column, table2.colum 

from tablel 

full join table2 on (tablel.column=table2.column) ; 

// 专 有 写法 

select tablel .column, table2.colum 

from tablel, table2 

where tablel.column (+) =table2.column (+) ; 

对 于 这 两 种 写法 ， 在 某 些 场合 下 性 能 会 有 差异 ， 一 般 建 议 使 用 专 有 写法 。 


12.2” 表 关联 实现 方法 


针对 表 关 联 操作 ，Oracle 支 持 多 种 实现 方法 ， 最 为 常见 的 有 谋 套 循环 、 排 序 合 并 和 哈 希 连接 。 针 对 这 三 种 实现 方式 ， 可 以 做 个 简单 的 对 比 ， 如 表 12-1 所 示 。 


类 


使 用 条 件 


相关 资源 CPU、 人 磁盘 IO 


别 贬 套 循环 连接 


表 12-1 表 关 联 三 种 实现 方式 对 比 


排序 合并 连接 


主要 用 于 不 等 价 连接 ， 
如 <、<=、>、>=; 但 是 


不 包括 <> 


内 存 、 临 时 空间 


哈 希 连接 


仅 用 于 等 价 连接 


内 存 、 临 时 空间 


当 有 高 选择 性 索引 


制 性 搜索 时 效 
快速 返回 第 一 次 的 搜索 


洁 


当 索 引 丢 失 或 者 查 
制 不 够 时 ， 
纪录 数 较 多 


缺点 
多 时 ， 


简单 总 结 一 下 ， 常 见 三 类 连接 方式 的 适用 场景 。 
1) 谱 套 循环 : 
:如果 外 部 表 比 较 小 ， 并 且 在 内 部 表 上 有 唯一 索引 ， 或 有 高 
“ 谋 套 循环 有 其 他 连接 方法 没有 的 一 个 优点 : 
2) 排序 合并 连接 : 

“ 对 于 非 等 值 连接 ， 这 种 连接 方式 的 效率 是 比较 高 的 。 


“ 如 果 在 关联 的 列 上 都 有 索引 ， 效 果 更 好 。 


妇 率 比较 雇 高 ， 


效率 很 低 ; 
效率 较 低 


汝 多 


或 进 行 限 
Ly 


缺乏 索引 或 者 索引 条 
件 模糊 时 ， 排序 合并 连接 
共 结 5 比 峙 套 循环 有 效 

所 有 的 表 都 需要 排序 
它 为 最 优化 的 吞吐 量 而 设 
计 ， 并且 在 结果 没有 全 部 
找到 前 不 返回 数据 


询 条 件 限 
当 表 的 


选择 性 非 唯一 索引 时 ， 使 用 这 种 方法 可 以 得 到 较 高 的 效率 。 


当 缺 乏 索 引 或 者 索引 条 件 模糊 时 ， 
哈 硕 连接 连接 比 能 套 循 环 有 效 。 通 常 
比 排序 合并 连接 快 。 在 数据 仓库 环境 
下 ， 如 果 表 的 纪录 数 较 多 ， 


六 大 语 
效率 较 高 


为 建 立 哈 希 表 ，。 I 妇 
一 次 的 结果 返回 较 慢 


大 量 内 存 。 第 


可 以 先 返 回 已 经 连接 的 行 ， 而 不 必 等 待 所 有 的 连接 操作 处 理 完 才 返回 数据 ， 这 可 以 实现 快速 的 响应 时 间 。 


“ 对 于 将 两 个 较 大 的 行 源 做 连接 ， 该 连接 方法 比 嵌 套 循环 连接 要 好 一 些 。 但 是 如 果 排序 合并 返回 的 数据 量 过 大 ， 则 又 会 导致 使 用 过 多 的 ROWID。 在 表 中 查询 数据 时 ， 数 据 库 性 能 下 降 ， 因 为 I/O 过 多 。 
3) 哈 希 连 接 : 


“ 这 种 方法 是 在 Oracle7 后 才 引 入 的 ， 使 用 了 比较 先进 的 连接 理论 。 一 般 来 说 ， 其 效率 应 该 好 于 其 他 两 种 连接 ， 但 是 这 种 连接 只 能 用 在 CBO 优 化 器 中 ， 而 且 需 要 设置 合适 的 hash_area_size 参 数 ， 才 能 取得 
较 好 的 性 能 。 


“ 在 两 个 较 大 的 行 源 之 间 连 接 时 会 取得 相对 较 好 的 效率 ， 在 一 个 行 源 较 小 时 则 能 取得 更 好 的 效率 。 
“ 只 能 用 于 等 值 连接 中 。 
上 述 三 种 不 同 的 连接 方式 支持 的 连接 类 型 也 有 所 不 同 ， 如 表 12-2 所 示 。 


表 12-2 支持 的 连接 类 型 


连 接 藤 套 循环 连接 排序 合并 连接 哈 希 连接 
交叉 连接 党 车 3 

条 件 连 接 ¥ 逐 下 

等 值 连接 就 2 

半 / 反 连接 Y 和 区 

外 连接 Y 全 YY 

分 区 外 连接 六 演 ,4 


注 : 了 表示 支持 ; 义 表示 不 支持 。 


从 表 12-2 中 可 见 ， 哈 希 连 接 的 限制 还 是 较 多 的 。 后 面 将 针对 每 一 种 连接 ， 详 细 说 明 。 


12.3” 嵌 套 循 环 连接 


府 套 循环 (Nested Loop，NL) ， 是 一 种 最 常见 的 连接 方式 ， 也 是 一 种 “万 能 ”的 连接 方式 。 说 它 万 能 ， 是 因为 这 种 连接 方式 可 以 适用 于 各 种 情况 ， 当 然 其 处 理 效率 不 一 定 是 最 高 的 。 下 面 我 们 看 看 这 
种 方式 的 工作 流程 。 


1. 工 作 流 程 


为 了 便于 理解 ， 先 看 一 段 伪 代 码 。 


select tl1.coll, t2.col2 
from tl1, t2 
where tl1.col3={value} and t1.idl=t2.idl; 
=> 
for rl in (select rows from tl where col3={value} ) loop // tl1 外 部 表 
for r2 in (select rows from t2 that match current row from t2) loop // t2 内 部 表 
if rl=r2 then output values from current rows of tl and 七 2 
end loop 
end loop 


解释 一 下 上 述 代码 : 
“ 优化 器 根据 基于 规则 RBO 或 基于 成 本 CBO 的 原则 ， 选 择 两 个 表 中 的 一 个 作为 驱动 表 ， 并 指定 其 为 外 部 表 。 上 例 中 选择 了 tl 表 为 外 部 表 。 
“ 优化 器 再 将 另外 一 个 表 指 定 为 内 部 表 。 上 例 中 选择 t2 表 作为 内 部 表 。 


' 从 外 部 表 中 读 取 第 一 行 ， 然 后 和 内 部 表 中 的 数据 逐一 进行 对 比 ， 所 有 匹配 的 记录 放 在 结果 集中 。 此 过 程 对 应 上 例 中 从 外 部 表 t1 提 取出 r1 ， 然 后 从 内 部 表 t2 提 取出 t2， 两 者 若 匹 配 就 可 以 输出 ， 运 行内 层 
循环 直到 完成 所 有 记录 匹配 。 


“ 读 取 外 部 表 中 的 第 二 行 ， 再 和 内 部 表 中 的 数据 逐一 进行 对 比 ， 将 所 有 匹配 的 记录 添加 到 结果 集中 。 上 例 中 外 层 循环 重复 提取 出 t1 进行 比较 。 


“ 重复 上 述 步骤 ， 直 到 外 部 表 中 的 所 有 纪录 全 部 处 理 完 ; 最 后 产生 满足 要 求 的 结果 集 。 


也 可 以 概括 为 图 12-1 所 示 的 情况 。 


从 第 1 张 表 在 第 2 张 表 中 查找 
读 取 记录 | 匹配 的 记录 


息 否 有 更 多 第 1 张 \\、。 | 将 匹配 的 记录 
表 中 的 记录 ? 添加 到 结果 集中 


图 12-1 庶 套 循环 工作 流程 


下 面 通过 一 个 具体 的 案例 ， 帮 大 家 理解 一 下 它 的 工作 流程 。 


SQL> create table emp as select * from scott.emp; 
// 表 已 创建 

SQL> create table dept as select * from scott.dept; 
// 表 已 创建 


SQL> select /*+ use nl (a, b) */ a.dname, b.empno from dept a, emp b where a.deptno = b.deptno; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT 1 | 2 576 | 9 0) | V0 00 OL 
| 1 | NESTED LOOPS 1 | 2 | 576 | 9 《907 | 00: D000E 1 
| 艺 | TABLE ACCESS FULL| DEPT | 4 1 88 | 3 40 | D0: D0 dL | 
| | TABLE ACCESS FULL| EMP | 3 | 78 | 2 (0) | 00: 00: 01 | 


3 ~ filter ("A"."DEPTNO"="B"."DEPTINO®) 
信 这 里 使用 了 一 个 提示 DSE_NL， 上 的 是 保证 示例 SO 二 放 矢 倘 环 。 台 认 情 况 下 ， 它 是 二 的 男 外 一 和 连接 方式 


下 面 说 明 一 下 这 条 SQL 语 句 的 执行 过 程 。 


1) 优化 器 首先 在 关联 对 象 中 选择 驱动 表 ， 另 外 一 个 对 象 则 作为 被 驱动 表 。 这 里 选择 了 DEPT 表 作为 驱动 表 ，EMP 表 作为 被 驱动 表 。 通 常情 况 下 ， 一 般 是 选择 较 小 的 结果 集 作为 驱动 表 ， 因 为 这 样 可 以 比 


其 他 结果 集 执 行 更 少 的 循环 ， 从 而 提高 性 能 。 


2) 循环 外 层 驱动 表 ， 读 取 一 条 记录 ， 然 后 按照 指定 的 条 件 “filter ("A"."DEPTNO"="B"."DEPTNO") ′， 循环 被 驱动 表 ， 寻 找 匹配 记录 。 找 到 匹配 记录 后 ， 放 到 待 返回 结果 集中 。 


3) 循环 外 层 驱动 表 ， 读 取 下 一 条 记录 ， 循 环 上 述 过 程 。 


4) 待 外 层 循环 执行 完毕 后 ， 将 结果 集 返 回 。 


下 面 我 们 看 看 影响 谋 套 循环 性 能 的 主要 因素 。 


2. 影 响 性 能 因素 


在 谋 套 循环 中 ， 最 影响 性 能 的 有 两 块 : 一 个 是 外 层 循环 次 数 ， 一 个 是 内 层 查询 效率 。 前 者 很 好 理解 ， 循 环 次 数 越 少 ， 当 然 效 率 越 高 。 后 者 往往 是 我 们 性 能 调整 的 重点 。 


(1) 外 层 循环 次 数 


首先 我 们 来 看 看 第 一 种 情况 ， 外 层 循 环 次 数 对 表 关 联 性 能 的 影响 。 先 看 一 个 示例 。 


SQL> create table emp as select * from scott.emp; 
Table created 。 

SQL> create table dept as select * from scott.dept; 
Table created. 


SQL> select /*+ use nl (a, b) */ a.dname，b.empno from emp b, dept a where a.deptno = b.deptno; 


Id Operation | Name Rows Bytes Cost (%CPU) Time | 
0 SELECT STATEMENT | 14 672 9 (0) 00: 00: 01 | 
下 NESTED LOOPS | 14 672 9 (0) 00: 00: 01 | 
2 TABLE ACCESS FULL| DEPT 4 88 3 (0) 00: 00: 01 | 
| TABLE ACCESS FULL| EMP 4 104 2 (0) 00: 00: 01 | 


// 在 这 种 情况 下 ， 优 化 器 选择 DEPT 表 为 外 部 表 ，EMP 表 为 内 部 表 。 整 体 成 本 开销 为 9 


Rd Operation | Name Rows Bytes Cost (%CPU) Time | 
0 SELECT STATEMENT | 14 672 20 (0) 00: 00: 01 | 
二 NESTED LOOPS 1 14 672 20 (0) 00: 00: 01 | 
2 TABLE ACCESS FULL| EMP 14 364 3 (0) ET 
才 / TABLE ACCESS FULL| DEPT 1 22 1 (0) V0 Oe LT | 


SQL> select /*+ ordered use nl (a, b) */ a.dname, b.empno from emp b, dept a where a.deptno = b.deptno; 


hi 该 语句 通过 使 用 一 个 提示 ORDERED， 改 变 了 优化 器 对 表 的 选择 。 这 条 语句 的 执行 计划 使 用 了 EMP 表 为 外 部 表 ，DEPT 为 内 部 表 。 整 体 成 本 开销 为 20。 对 于 上 述 示例 ，DEPT 表 记录 数 为 4，EMP 表 记录 数 为 14， 这 也 和 


这 里 使 用 了 ORDERED 提 示 ， 它 的 作用 是 按照 FROM 子 名 的 顺序 来 指定 表 间 连接 上 顺序。 使 用 ORDERED 提 示 可 以 节省 大 量 的 分 析 时 


优化 器 连接 表 的 最 佳 顺 序 。 


一 般 情 况 下 ， 选 择 外 部 表 的 原则 是 ， 外 层 循环 的 次 数 越 少 越 好 。 这 也 就 是 将 小 表 或 返回 较 小 row source 的 表 作 为 驱动 表 (用 于 外 层 循环 ) 的 理论 依据 。 但 是 这 个 理论 只 是 一 般 指导 原则 ， 


理论 并 不 能 总 保证 语句 产生 的 MO 次 数 最 少 。 有 时 不 遵守 这 个 理论 依据 ， 反 而 会 获得 更 好 的 效率 。 如 果 使 


很 差 。 在 谋 套 循环 中 ， 选 择 有 较 小 结果 集 的 表 (并 不 一 定 是 较 小 的 表 ) 作为 驱动 表 ， 可 以 比 使 用 其 他 结果 集 (从 非 驱动 表 中 提取 的 ) 执行 
WHERE 限 制 条 件 后 ， 可 以 返回 较 少 行 数据 的 表 (前 提 是 不 使 用 并 行 操作 ) ， 所 以 大 表 也 可 能 成 为 驱动 表 ， 关 键 看 限制 条 件 。 


对 于 并 行 查询 ， 经 常 选择 大 表 作 为 驱动 表 ， 因 为 大 表 可 以 充分 利用 并 行 功能 。 当 然 ， 有 时 对 查询 使 


而 且 还 要 看 你 的 硬件 配置 是 否 可 以 支持 并 行 (如 是 否 有 多 个 CPU、 多 个 硬盘 控制 器 ) ， 所 以 要 具体 问题 


体 对 待 。 


并 行 操作 并 不 一 定 会 比 不 使 


间 (特别 是 在 表 非 常 多 的 情况 下 ) ， 并 加 速 SQL 的 执行 ， 因 为 这 告诉 了 


为 遵循 这 个 


这 种 方法 ， 决 定 使 用 哪个 表 作 为 驱动 表 很 
更 少 的 循环 ， 通 常 也 导致 最 佳 的 性 能 。 


要 。 有 时 如 果 驱动 表 选 择 不 正确 ， 将 会 导致 语句 的 性 能 


并 行 操作 效率 高 ， 


在 三 表 连 接 中 ， 驱 动 表 应 当 是 交叉 表 或 者 是 在 连接 中 和 其 他 两 张 表 都 有 连接 条 件 限制 的 表 。 可 以 尝试 使 


得 的 结果 集 将 很 小 。 


(2) 内 层 查 询 效率 


对 性 能 影响 较 大 的 往往 是 内 层 查 询 效率 。 先 来 看 上 面 的 示例 ， 其 内 层 使 用 的 是 全 表 扫 描 的 方式 来 检索 数据 。 让 我 们 尝试 改变 一 下 ， 看 看 效果 。 


SQL> create index idx deptno on emp (deptno) ; 


// 索 引 已 创建 

SQL> select /*+ use nl (a, b) */ a.dname, b.empno from dept a, emp b where a.deptno = b.deptno; 
| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | 

| 0 | SELECT STATEMENT | | by 576. 1 6 (0) | 

| 1 | NESTED LOOPS | | | | | 

| | NESTED LOOPS | | 12 | 576 | 6 (0) | 

| 村 TABLE ACCESS FULL | DEPT | 4 1 88 | 3 (0) 1 

I* 41 INDEX RANGE SCAN | IDX DEPTNO | 4 | | 0 (0) | 

| 5 | TABLE ACCESS BY INDEX ROWID| EMP 3 78 | 1 (0) | 


/* 新 创建 索引 后 ， 执 行 计划 发 生 了 变化 ， 现 在 是 两 层 诬 套 循环 ， 核 心 是 在 ID=4 的 步骤 。 不 再 通过 全 表 扫 描 获 得 数据 ， 而 是 通过 新 创建 的 索引 IDX_DEPTNO 完 成 匹配 记录 的 查找 。 直 观 印 象 是 ， 总 体 语句 的 成 本 从 9 下 降 到 6 
wf 


最 好 的 驱动 表 是 那些 应 用 了 


因为 最 后 可 能 每 个 表 只 有 很 少 的 行 符合 限制 条 件 ， 


限制 条 件 最 多 的 表 (或 者 交叉 表 ) 作为 驱动 表 。 这 样 当 连 接 第 三 张 表 时 ， 从 前 两 张 表 连接 所 获 


对 于 内 部 表 的 访问 ， 一 般 都 是 通过 索引 来 完成 的 ， 这 有 两 种 形式 : 一 种 是 优化 器 利用 内 部 表 上 的 索引 进行 唯一 扫描 (unique scan) ; 另 一 种 则 是 进行 索引 范 上 


形式 ,可 以 减少 较 大 的 谋 套 连接 中 的 逻辑 1/O 数 量 。 执 行 计划 随 着 驱动 表 中 行 数 的 变换 而 转变 机 制 。 这 里 有 个 参数 需要 关注 ， 就 是 optimizer_index_caching， 它 反 
设置 到 75% 是 比较 合适 的 。 当 执行 循环 的 第 一 遍 时 ， 索 引 访 问 路 径 可 能 会 引发 物理 读 ， 以 将 数据 读 入 缓冲 区 ， 可 供 后 续 的 循环 重复 使 用 。 


此 外 ， 上 面 的 执行 计划 中 还 有 一 点 值得 注意 。 在 ID = 5 的 步骤 中 ， 是 通过 ROWID 访 问 EMP 表 的 。 这 呈 


隐藏 了 一 个 


有 实 ， 那 就 是 在 内 


立刻 回 表 ， 而 是 集中 起 来 在 外 面 最 后 访问 了 内 部 表 一 一 EMP。 这 种 方式 的 好 处 在 于 ， 如 果 提 取 的 数据 在 一 个 物理 块 上 ， 那 么 这 种 方式 可 以 减少 逻辑 读 乃 至 物理 读 。 传 统 方式 的 话 ， 访 问 几 次 内 


几 次 ， 访 问 几 次 逻辑 读 ， 甚 至 物理 读 。 
除了 常规 的 谋 套 循环 外 ， 还 有 两 种 特殊 的 谋 套 循环 ， 我 们 来 看 看 。 
3 特殊 的 说 套 循环 


(1) FILTER 


扫描 (range scan) 。 如 果 采 


第 二 种 


层 的 谋 套 循环 中 ， 通 过 索引 


决 的 是 索引 块 被 缓存 的 比例 。 一 


这 种 庶 套 循环 和 普通 的 庶 套 不 同 ， 在 内 层 循环 中 第 一 行 被 连接 成 功 之 后 就 立刻 结束 内 层 循环 ， 不 再 继续 执行 下 去 。 这 种 处 理 方式 所 制定 的 执行 计划 类 型 被 称 为 FILTER。 我 们 看 一 个 案例 。 


SQL> select outer.* 
2 from emp outer 


3 where outer.sal > 

a 《 

每 select /*+ no_unnest */ avg (inner.sal) 

6 from emp inner 

7 where inner.deptno = outer.deptno 

8 ) 
| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT | | | 87 | 6 (0) | 00: 00: 01 1 
|* 1 | FILTER | 1 | 1 | 
| 证 TABLE ACCESS FULL | EMP | 12 | 1044 | 3 (0) | 00: 00: 01 | 
| 3 | SORT AGGREGATE [ | | 26 | | 
I* 4 1 TABLE ACCESS FULL| EMP | 11 26 | 3 (0) | 00: 00: 01 | 


投 来 说 ， 


IDX_DEPTNO 找 到 对 应 的 ROWID 后 没有 
层 循环 就 回 表 


显然 ，FILTER 方 式 相 较 于 传统 的 谋 套 循环 方式 更 加 高 效 。 


(2) 集群 连接 


群集 连接 实际 上 是 谋 套 连接 的 一 种 特例 。 如 果 所 连接 的 两 张 行 源 表 实 际 上 是 群集 中 的 表 ， 并 且 连 接 两 张 行 源 的 群集 键 间 是 等 价 连接 的 ， 那 么 在 Oracle 中 就 能 使 


一 张 行 源 表 中 读 取 第 一 行 ， 并 在 第 二 张 行 源 表 中 使 
种 连接 方式 很 少 使 用 ) 。 


类 别 其 他 表 连 接 方式 ， 谋 套 循环 适应 范围 很 广 。 


4. 优 缺点 


(1) 优点 


使 


cluster 索 引 查 找到 所 有 匹配 的 项 。 群 集 索 引 效 率 很 高 ， 


因为 两 个 参加 连接 的 行 源 表 实际 上 处 于 同一 个 物理 块 。 


群集 连接 了 。 这 种 情况 下 ，Oracle 从 第 
( 因 和 集群 在 实际 环境 中 应 


此 这 


不 多 ， 


是 比较 理想 的 。 调 套 循 环 连接 比 其 他 连接 方法 更 具 优势 ， 如 可 以 快速 地 从 结果 集中 提取 第 一 批 记录 ， 而 不 


而 在 同时 读 取 其 他 记录 。 


不 管 如 何 定义 连接 的 条 件 或 者 模式 ， 任 何 两 行 记录 源 都 可 以 使 


当 驱 动 表 的 数据 量 很 大 ( 集 的 势 高 ) 时 ， 这 样 可 以 并 行 扫描 内 表 。 


(2) 缺点 


千 待 整个 结果 集 完全 确定 下 来 。 在 理想 情况 下 ， 终 端 
谍 套 循环 连接 ， 所 以 谋 套 循环 连接 是 非常 灵活 的 。 赃 套 循 环 连接 方式 的 效率 比 排序 合并 连接 方式 效率 更 高 ， 特 别 是 


谋 套 循环 连接 是 一 种 从 结果 集中 提取 第 一 批 记录 最 快速 的 方法 。 在 驱动 行 源 表 (就 是 正在 查找 的 记录 ) 较 小 、 内 部 行 源 表 已 连接 的 列 有 唯一 的 索引 或 高 度 可 选 的 非 唯一 索引 时 ， 嵌 套 循环 连接 效果 


户 就 可 以 通过 查询 


lf 幕 查看 第 一 批 记录 ， 


如 果 内 部 行 源 表 已 连接 的 列 上 不 包含 索引 ,或 者 索引 不 是 高 度 可 选 时 ， 赃 套 循环 连接 效率 是 很 低 的 。 如 果 驱 动 表 的 记录 非常 庞大 ， 其 他 的 连接 方法 可 能 更 加 有 效 。 


(3) 对 比 


在 某 种 意义 上 ， 排 序 合并 连接 和 散 列 连接 可 以 被 认为 是 同一 类 的 连接 一 一 它们 在 某 种 类 似 的 条 件 下 都 提供 优异 的 性 能 ， 而 庶 套 循环 连接 则 适 


决定 说 套 循环 连接 是 否 合适 。 需 要 基于 以 下 条 件 做 决定 : 


于 另 一 类 查询 。 


“ 对 吞吐 量 的 需求 和 对 响应 时 间 需 求 的 比较 。 嵌 套 循环 通常 可 以 提供 更 快 的 响应 时 间 ， 而 散 列 /排序 合并 连接 通常 会 提供 更 大 的 吞吐 量 。 


“ 参与 连接 的 记录 在 表 中 的 比例 。 被 处 理 的 记录 的 子 集 越 大 ， 排 序 合并 或 散 列 连接 就 可 能 越 快 。 


“ 是 否 有 索引 可 


来 支持 连接 。 访 套 循环 连接 的 方法 通常 只 在 索引 可 用 于 连接 表 时 才 有 效 。 


* 散 列 连接 或 许可 以 从 并 行 执行 和 针对 分 区 的 操作 中 获得 更 大 的 益处 ,虽然 说 套 循环 和 排序 合并 连接 也 可 以 并 行 执行 。 


当 连 接 涉及 的 记录 只 占 表 中 相对 小 的 比例 并 且 有 索引 支持 时 ， 


np 


12.4 ”排序 合并 连接 


排序 合并 连接 (Sort Merge Join) ， 也 是 一 种 常 


集 。 与 嵌 套 循环 为 了 执行 表 连 接 需 
增加 了 连接 的 代价 。 引 入 这 种 连接 方式 的 目的 是 缩减 在 嵌 套 循环 连接 中 发 生 的 随机 读 


在 缺乏 数据 的 选择 性 或 者 可 
SORT AREA_SIZE 设 置 太 小 的 情况 下 ) ， 这 将 导致 临时 表 空 间 占 上 


按 随机 方式 读 取 数 据 不 同 ， 排 序 合并 连接 为 了 使 


汉 量 。 


更 多 的 内 存 和 磁盘 


列 ， 则 会 大 大 提高 效率 。 


在 连接 条 件 中 主要 使 


的 是 LIKE、BETWEEN、>、 


光志、 老 


排序 合并 连接 可 适 


在 连接 条 件 相等 的 情况 下 ， 
需要 对 所 有 输入 表 进 行 村 


多 种 情况 〈 但 并 非 全 部 ) ， 且 都 能 


0 排序 合并 连接 则 可 以 


的 索引 时 ,或 者 两 个 源 表 都 过 于 庞大 (超过 记录 数 的 5%) 时 ， 排 序 合 并 连接 将 比 嵌 套 循环 连接 更 加 有 效 。 但 
/O。 排 序 本 身 就 是 个 极其 消耗 资源 的 操作 ， 特 别 是 对 于 大 
、<= 而 不 是 = 比较 运算 符 的 情况 下 ， 该 方式 比 让 套 循环 有 效 。 若 使 


散 列 连接 。 而 直接 比较 散 列 连接 和 排序 合并 连接 时 ， 散 列 连 接 通 常 效率 更 高 。 
来 完成 不 等 连接 。 散 列 连接 和 排序 合并 连接 都 必须 对 所 有 输入 表 执行 全 表 扫 描 。 散 列 连 接 的 一 个 优势 是 ， 它 只 需 对 一 张 表 创建 散 列 ， 而 寺 


F 序 。 因 此 ， 排 序 合并 连接 需要 更 多 的 内 存 才 能 高 效 运行 ， 而 在 排序 时 可 能 需 


下 面 来 看 看 排序 合并 连接 的 工作 流程 。 


1. 工 作 流 程 


使 


排序 合并 表 连 接 ， 必 须 先 对 两 个 表 中 将 要 执行 的 行 排序 。 


的 连接 方式 。 其 工作 方式 是 分 别 将 关联 的 两 张 表 按 它们 各 自 要 连接 的 列 排序 ， 然 后 将 已 经 排序 的 两 个 源 表 合并 。 如 果 找到 


于 排序 的 内 存 与 CPU。 大 的 排序 可 能 消耗 大 量 的 资源 并 可 能 减 慢 执 行 的 速度 。 排 序 合并 包含 两 次 排序 ， 而 谍 套 循环 通常 不 包含 排序 。 散 列 连接 也 需要 内 存 来 构建 散 列表 。 


谍 套 循环 连接 方法 较为 适合 。 而 当 表 的 大 部 分 数据 参与 连接 或 没有 合适 的 索引 时 ， 排 序 合并 和 散 列 连 接 则 更 适合 。 


因此 ， 在 决定 最 优 的 连接 类 型 时 ， 需 要 先 


匹配 的 数据 ， 就 放 到 结果 


然 这 种 方法 提高 了 连接 的 效率 ， 但 是 由 于 排序 的 存在 ， 也 


由 于 排序 合并 连接 需 
的 数据 源 。 但 如 果 数 据 源 是 预先 排 好 


非 = 比 较 运 算 符 ， 则 


排序 合并 连接 操作 比 散 列 连接 适 


临时 的 内 存 块 以 用 于 排序 (在 
序 的 ， 例 | 
丛 希 连接 无 法 使 用 。 


已 经 被 索引 


范围 


更 / 


。 散 列 连 接 只 能 


更 多 的 CPU。 如 果 输 入 数据 集 已 经 是 有 序 的 或 需要 对 输出 排序 ， 风 


合并 连接 见 


散 列 连接 的 优点 就 会 被 抵消 。 


排序 合并 与 前 面 所 讲 的 谋 套 循环 不 同 ， 它 没有 所 谓 驱 动 表 、 探 查 表 之 类 的 概念 。 两 个 数据 源 是 相互 独立 的 ， 下 
。 如 果 已 经 进行 了 排序 或 连接 列 上 有 索引 ， 则 不 需要 进行 排序 操作 。 


下 面 看 看 其 执行 过 程 。 


1) 优化 器 判断 第 一 


2) 第 一 个 源 表 排序 。 


个 源 表 是 否 已 经 排序 ， 如 果 已 经 排序 ， 则 到 第 3 步 ， 否 则 到 第 2 步 。 


3) 优化 器 判断 第 二 个 源 表 是 否 已 经 排序 ， 如 果 已 经 排序 ， 则 到 第 5 步 ， 否 则 到 第 4 步 。 


4) 第 二 个 源 表 排序 。 


5) 对 已 经 排 过 序 的 两 个 源 表 进行 合并 操作 ， 并 生成 最 终 的 结果 集 。 


上 述 流程 可 概括 为 


到 12-2 所 示 形 式 。 


面 会 简称 为 第 一 个 源 表 、 第 二 个 源 表 。 为 了 实现 连接 ， 需 


做 的 就 是 按照 连接 列 进行 排 


对 表 1 排 序 


对 表 2 排 序 有 序 临 时 段 2 


合并 临时 段 


12-2 ”排序 合并 连接 工作 流程 


下 面 通过 一 个 具体 的 案例 ， 帮 大 家 理解 一 下 排序 合并 连接 的 工作 流程 。 


SQL> select a.dname, b.empno from dept a, emp b where a.deptno = b.deptno; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | 
| 0 | SELECT STATEMENT | | bp 576 | 6 (17) | 
| 1 | MERGE JOIN | | 12 | 576 | 6 (17) | 
| | TABLE ACCESS BY INDEX ROWID| DEPT | 41 88 | 2 Cay | 
| | INDEX FULL SCAN | IDX DEPT DEPTNO| 4 1 | 1 (0) | 
I*41 SORT JOIN | |: 12° | 312 | 4 (25) | 
| 于 二 TABLE ACCESS FULL | EMP | 12 | 312 | 3 (0) | 


/* 延 续 上 面 的 示例 ， 这 次 不 添加 提示 ， 优 化 器 选择 了 排序 合并 。 在 构造 两 个 结果 集 时 ， 前 面 一 个 使 用 了 现成 的 索引 结构 ， 通 过 索引 全 扫描 返回 一 个 有 序 结构 ; 后 面 一 个 则 通过 全 表 扫描 后 排序 ， 取 得 一 个 有 序 结果 集 


本 


下 面 说 明 这 条 SQL 语句 的 执行 过 程 。 


1) ID =2、3 的 步骤 ， 优 化 器 选择 DEPT 表 作为 第 一 源 表 ， 通 过 索引 全 扫描 的 方式 访问 索引 然后 回 表 查 。 因 为 索引 本 身 就 是 有 序 结构 ， 因 此 第 一 源 表 需要 再 排序 。 这 里 还 需要 关注 一 点 ， 索 引 的 扫描 方式 
是 “INDEX FULL SCAN” ， 而 没有 使 用 “INDEX FAST FULL SCAN”。 原 因 就 在 于 使 用 快速 全 扫描 方式 时 采用 多 块 读 取 模式 ， 其 返回 的 结果 是 无 序 的 ， 对 于 排序 合并 而 言 ， 需 要 一 个 有 序 的 结果 ， 因 此 采 
用 索引 全 扫描 方式 。 


2) ID =4、5 步 又， 优化 器 选择 EMP 表 作为 第 二 源 表 ， 通 过 全 表 扫 描 方式 取得 数据 后 进行 排序 。 


3) ID = 1 步骤 ， 完 成 了 两 个 有 序 结果 集 的 合并 操作 ， 并 返回 连接 后 的 结果 集 。 


我 们 下 面 看 看 ， 如 果 DEPT 表 不 存在 索引 又 会 如 何 ? 


SQL> drop index idx dept deptno; 
// 索 引 已 删除 
SQL> select a.dname，b.empno from dept a, emp b where a.deptno = b.deptno; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | 
| 0 | SELECT STATEMENT | | 12, ] 576 | 学 (15y | 
I* 1 | HASH JOIN 1 | 2 576 | 学 (15) | 
| A | TABLE ACCESS FULL| DEPT | 4 1 88 | 3 (0) | 
| 3 1 TABLE ACCESS FULL| EMP | 12 | 312 | 3 (0) | 


/* 优 化 器 没有 再 选择 排序 合并 ， 而 是 使 用 了 另外 一 种 方式 一 哈 希 连接 。 为 什么 这 里 没有 选择 使 用 排序 合并 呢 ? 原因 是 优化 器 评估 了 对 两 个 表 排序 后 ， 然 后 合并 的 代价 ， 最 后 选择 了 另外 一 个 表 连 接 方式 


3 


在 Oracle 中 还 提供 了 一 个 提示 ， 强 制 走 排序 合并 ， 这 就 是 USE_MERGE。 下 面 看 看 它 的 用 法 。 还 是 延续 上 面 的 示例 。 


SQL> select /*+ use merge (a, b) */ a.dname，b.empno from dept a, emp b where a.deptno = b.deptno; 


| 0 | SELECT STATEMENT | | 12 | 576 | 8 5) | 
| 1 | MERGE JOIN | | 12: | 576 | 8 (25) | 
| 2 | SORT JOIN | | ,| 88 | 4 (25) | 
| 3 1 TABLE ACCESS FULL| DEPT | | 88 | 3 (0) | 
|* 4 1 SORT JOIN | | 12 | 312 | 4 (25) | 
| § |] TABLE ACCESS FULL| EMP | 12 1 312 | 3 (0) | 


人 球状 太古 器 谋 全 提 ; 两 个 表 都 做 了 排序 。 从 输出 可 见 ， 此 时 的 成 本 是 8， 原 来 的 那 种 哈 希 连接 方式 成 本 是 7， 这 也 解释 了 为 什么 在 不 加 提示 的 情况 下 ， 选 择 了 哈 希 连接 


2 排序 效率 


在 排序 合并 连接 中 ，Oracle 分 别 将 第 一 源 表 、 第 二 源 表 按 它们 各 自 要 连接 的 列 进行 了 排序 ， 然 后 将 已 经 排序 的 两 个 源 表 合并 。 如 果 找 到 匹配 的 数据 ， 就 放 到 结果 集 。 按 照排 序 执行 效率 的 不 同 ， 可 分 为 
下 面 几 种 情况 。 


: 最 优 排序 (optimal sort) : 执行 时 数据 全 部 在 内 存 中 。 读 取 一 个 数据 流 并 将 其 排序 ， 执 行 时 全 部 数据 都 在 内 存 中 。 在 内 存 消耗 完 之 前 ， 数 据 已 经 读 取 完 毕 ， 因 此 不 需要 使 用 磁盘 空间 作为 临时 工作 
区 。 需 要 注意 的 是 ， 内 存 是 随 着 数据 的 读 入 逐步 分 配 的 ， 而 不 是 在 开始 排序 时 就 分 配 全 部 sort_atea_size (或 由 pga_aggregate_target 规 定 的 上 限 ) 大 小 的 内 存 。 


:一遍 排序 (onepass sort) : 数据 量 大 而 无 法 一 次 全 部 读 入 内 存 的 情况 。 将 一 次 能 够 处 理 的 数据 量 读 入 内 存 并 对 其 排序 。 当 达到 内 存 上 限时 ， 就 将 已 排序 数据 集 转 储 到 磁盘 。 重 复 这 个 过 程 ， 直 到 处 理 
完 所 有 的 输入 数据 。 此 时 磁盘 上 存在 一 些 经 过 排序 的 数据 集 ， 接 下 来 必须 将 它们 归并 为 一 个 集合 。 如 果 内 存 足 够 容纳 从 每 个 已 排序 的 数据 集中 各 读 取 一 块 ， 那 么 就 属于 一 遍 排 序 。 


: 多 遍 排序 (multipass sort) : 开始 时 与 一 遍 排序 类 似 ， 但 其 针对 的 情况 是 所 有 数据 都 处 理 完 并 写 至 磁盘 ， 且 当前 会 话 发 现 内存 不 足以 容纳 从 每 个 已 排序 的 数据 集中 各 读 取 一 块 。 在 这 种 情况 下 ， 必 须 归 
并 一 些 数据 流 ， 把 一 个 较 大 的 数据 流 写 回 到 磁盘 ， 然 后 再 归并 几 个 数据 流 ， 把 另 一 个 较 大 的 数据 流 写 回 磁盘 。 最 后 ， 所 有 最 初 的 数据 流 处 理 完毕 ， 接 下 来 将 一 些 较 大 的 数据 流 读 回 内存 然 后 归并 它们 。 最 终 
归并 磁盘 上 的 全 部 数据 流 。 必 须 读 取 数 据 的 次 数 称 为 归并 的 遍 数 。 


3 排序 参数 


(1) SORT AREA RETAINED SIZE 


SORT_AREA_RETAINED_SIZE 上 默认 值 是 0， 意味 着 其 应 动态 调整 本 身 以 匹配 SORT_AREA_SIZE 的 当前 设置 。 如 果 设置 为 非 0， 则 会 产生 两 个 效果 : 第 一 ， 会 改变 Oracle 申 请 和 释放 内 存 的 方式 。 第 二 ， 影 
响 Oracle 使 用 临时 表 空 间 的 方式 。 


分 配方 式 是 ， 首 先 分 配 UGA 中 的 内 存 ， 但 当 UGA 内 存 的 分 配 达 到 SORT_AREA_RETAINED_SIZE 所 设 定 的 界限 时 ， 就 会 分 配 PGA 中 的 内 存 。 即 使 排序 在 内 存 中 完成 ， 但 如 果 这 部 分 内 存 被 分 为 UGA 和 
PGA， 则 整个 已 排序 数据 集 将 会 被 转 储 到 磁盘 上 。 这 也 是 在 统计 信息 中 能 看 到 “physical writes direct” 的 原因 。 


若 使 用 共享 服务 器 方式 ， 则 UGA 在 SGA 中 ， 因 此 最 多 sort_area_retained _ size 的 内 存 将 从 SGA 中 分 配 (通常 是 从 大 池 中 分 配 ， 如 果 没 有 设置 大 池 ， 则 从 共享 池 中 分 配 ) 。 超 出 的 内 存 需 要 量 ， 最 多 
(sort_area_size-sort_area_retained_size) 将 从 PGA 中 分 配 。 如 果 sort_area_retained_size 比 sort_area_size 小 ， 那 么 当 排 序 完成 时 ， 已 排序 数据 将 被 传 到 磁盘 ，PGA 中 分 配 的 多 余 内 存 可 以 被 其 他 操作 所 
， 并 且 sort_area_retained_size 将 用 于 重新 读 入 转 储 数据 供 以 后 使 用 。 


(2) PGA AGGREGATE TARGET 


在 使 用 自动 WORKAREA_SIZE_POLICY 的 情况 下 ，PGA_AGGREGATE_TARGET 参 数 为 Oracle 设 置 了 一 个 记 账目 标 。 这 个 目标 为 所 有 执行 大 块 内 存 操作 (例如 排序 、 散 列 连 接 、 索 引 创 建 以 及 位 图 索引 
操作 ) 的 进程 定义 了 共用 内 存 总 量 的 一 个 上 限 。 注 意 ， 与 PL/SQL 操 作 有 关 的 内 存 (例如 数组 处 理 ) 不 受 这 一 机 制 的 控制 。 


默认 情况 下 ， 为 串 行 操作 分 配 的 任何 一 个 工作 区 最 大 被 限制 为 pga_aggregate target 的 59%; 对 并 行 操作 工作 区 分 配 的 限制 是 : 操作 中 涉及 的 所 有 并 行 子 进程 所 用 的 内 存 总 量 不 超过 
pga_aggregate target 的 30% (同时 每 个 子 进程 使 用 的 上 限 是 5%， 这 意味 着 若 执行 一 个 平行 度 超 过 6 的 查询 ， 则 只 能 看 到 30% 的 上 限 效果 了 ) 。 


上 述 行为 受到 一 些 隐 含 参数 限制 : 


“ _smm_max_size: 串 行 执行 分 配 内 存 的 上 限 。 事 实 上 _smm_max_size 的 上 默认 值 还 有 一 个 限制 ， 就 是 不 应 超过 _pga_max_size 的 一 半 。 


“ _smm_px_max_size: 并 行 执行 分 配 内 存 的 上 限 。 


* _smm_min_size: 一 个 会 话 所 能 获得 的 工作 区 的 最 小 有 效 内 存 。 


" _pga_max_size: 单个 会 话 所 能 使 用 的 内 存 上 限 ， 即 上 默认 值 为 200MB 的 _pga_max_size。 


(3) SORT_MULTIBLOCK READ COUNT 


SORT_MULTIBLOCK_READ_COUNT 决 定 了 进程 在 一 次 读 操作 中 能 够 从 单个 排序 合并 段 中 读 取 的 块 数 。 较 大 的 读 取 块 数 可 能 会 使 硬件 为 归并 操作 提供 更 高 的 性 能 ， 但 因为 归档 操作 在 总 的 可 用 内 存量 上 
有 严格 限制 ， 所 以 较 大 的 读 取 块 数 使 得 能 够 同时 读 取 及 归并 的 排序 合并 段 数 减少 了 。 如 果 无 法 在 一 遍 中 归并 所 有 的 排序 合并 段 ， 则 必须 一 次 归并 几 个 ， 在 执行 过 程 中 重新 写 回 结果 ， 然 后 对 生成 的 较 大 的 排 
序 合并 段 继续 执行 归并 。 从 9i 开 始 ， 这 种 情况 在 会 话 统计 中 报告 为 “workarea executions-multipass”， 这 通常 是 需要 避免 的 。 以 往 Oracle 不 建议 修改 这 个 参数 ， 通 常设 置 为 2 或 1。 如 果 是 在 手工 设置 工 
作 区 情况 下 ， 通 过 查看 10032 并 针对 特定 会 话 或 特定 语句 调整 这 个 参数 ， 可 以 使 数据 量 非常 大 的 排序 在 性 能 上 得 到 一 些 提 高 。 


4. 相 关 事件 


我 们 可 以 通过 一 些 系统 事件 来 观察 排序 合并 的 行为 。 


(1) 10032 event 
报告 排序 时 系统 内 相关 活动 的 统计 信息 。 


操作 : 


alter session set events '10032 trace name context forever' 
alter session set events '10032 trace name context off'; 


TRACE 文 件 (内 存 排序 ) : 


---- Sort Parameters 


sort area size 23593984 
// 内 在 排序 区 大 小 
sort area retained size 23593984 


// 内 在 排序 保留 区 大 小 《一 般 同 SORT_AREA SIZE) 
sort multiblock read count 1 

//8i 的 参数 ， 目 前 已 经 废 刊 

max intermediate merge width 

// 基 于 参数 计算 出 来 的 Oracle 最 大 同 人 结果 集 (用 来 判断 是 否 需 要 onepass/multipass) 


=----~ Sort Statistics 


Input records 1048576 
// 排 序 的 行 数 

Output records 1048576 
// 返 回 的 行 数 

Total number of comparisons performed 11293002 
// 对 比 的 次 数 

Comparisons Performed by in-memory sort 11293002 
// 在 内 存 中 发 生 的 对 比 次 数 

Total amount of memory used 23593984 
// 使 用 的 内 存 


Uses version 2 sort 
Does not use asynchronous IO 
~ End of Sort Statistics 


(2) 10033 event 


报告 所 发 生 的 MO 细节 。 


操作 : 


alter session set events '10033 trace name context forever' 
alter session set events '10033 trace name context off'; 


TRACE 文 件 : 


Recording run at 42bb89 for 62 blocks 

//“62 个 块 ”排序 合并 段 的 大 小 

Recording run at 42b598 for 18 blocks 
Merging run at 42b598 for 18 blocks 
//“42b598” 排 序 合并 段 的 起 始 地 址 

Merging run at 42bc06 for 62 blocks 

Total number of blocks to read: 1568 blocks 


说 明 : 


alter session set workarea size policy = manual; 
alter session set sort area size = 1048576; 


需要 提前 进行 上 述 操作 ， 如 果 只 是 内 存 排序 ， 则 不 会 产生 排序 合并 段 。 可 以 在 10033 中 看 到 这 些 排序 合并 段 。 
排序 合并 段 ， 说 明 都 在 内 存 中 完成 了 排序 动作 。 可 以 通过 试 错 的 方式 找 出 sort_area_size 多 大 才能 避免 磁盘 排序 ， 也 就 是 排序 合并 段 数目 为 0。 


12.5 ” 哈 希 连接 


哈 希 连接 (Hash Join) 是 一 种 引入 较 晚 的 连接 方式 。 目 的 主要 是 解决 谋 套 循环 连接 中 大 量 随 机 读 取 的 问题 ， 又 要 解决 提 


连接 对 象 集中 在 一 起 。 哈 希 函 数 并 不 直接 负责 连接 任务 ， 而 是 负责 把 将 要 连接 的 对 象 提 前 集中 在 特定 的 位 
必须 要 进行 连接 的 两 个 分 区 称 为 “分 区 对 ”。 实 际 上 ， 哈 希 连 接 是 以 分 区 对 为 对 象 来 执 和 
循环 ， 较 大 分 区 中 的 行 通过 外 侧 循环 来 执行 哈 希 连 接 。 


哈 希 连接 只 能 用 于 等 值 连接 ， 主 
CPU 的 消耗 更 加 明显 。 所 以 在 CPU 紧张 时 ， 最 好 限制 使 


哈 希 连接 。 


下 面 看 一 下 它 的 工作 流程 


1. 工 作 流 程 


哈 希 连接 中 ， 优 化 器 根据 统计 信息 ， 首 先 选择 两 个 表 中 的 小 表 ( 通 
记录 。 如 果 有 相 匹 配 的 数据 ， 则 将 数据 添加 到 结果 集中 。 


当 哈 希 表 构 建 完成 后 ， 


进行 下 面 的 处 理 。 


wk 


对 第 二 个 大 表 进 行 扫描 。 


2) 如 果 大 表 不 能 完全 CACHE 到 可 用 内 存 ， 则 大 表 同 样 会 分 成 很 多 分 区 。 


3) 大 表 的 第 一 个 分 区 CACHE 到 内 存 。 


4) 对 大 表 第 一 个 分 区 的 数据 进行 扫描 ， 并 与 哈 希 表 进行 


5) 与 第 一 个 分 区 一 样 ， 其 他 的 分 区 也 类 似 处 理 。 


比较 ， 如 果 有 匹配 的 记录 ， 则 添加 到 结果 集 里 面 。 


。 将 具有 相同 哈 希 值 的 数 拉 
连接 操作 的 。 在 连接 时 ， 将 较 小 分 区 中 的 数 


资源 消耗 为 CPU 消耗 (在 内 存 中 创建 临时 的 哈 希 表 ， 并 进行 哈 希 计算 ) ， 而 排序 合并 的 资源 消耗 主要 为 磁盘 /O 消 耗 (扫描 表 或 索引 ) 。 


F 序 合并 连接 中 排序 代价 过 大 的 
局 行 集中 存储 在 相同 的 空间 上 ， 该 空间 被 称 为 “分 区 


排序 时 转 储 到 磁盘 的 数据 格式 意味 着 转 储 的 总 数据 量 可 能 比 我 们 预期 的 大 很 多 。 如 果 没有 


问题 。 在 不 需要 排序 的 情况 下 ， 哈 希 函 数 就 能 够 把 


”。 在 这 些 分 区 中 


局 行 读 入 内 存 中 并 为 其 创建 临时 哈 希 表 ， 然 后 将 哈 希 表 中 的 行 视 为 内 侧 


在 并 行 


系统 中 ， 哈 希 连 接 对 


常 是 连接 结果 中 较 少 的 表 ) ， 在 内 存 中 建立 这 张 表 基 于 连接 键 的 哈 希 表 ; 然后 扫描 表 连 接 中 的 大 表 ， 并 根据 哈 希 表 检测 是 否 有 匹配 的 


6) 所 有 分 区 处 理 完 后 ，Oracle 对 产生 的 结果 集 进 行 归并 、 汇 总 ， 产 生 最 终 的 结果 。 


7) 当 哈 希 表 过 大 或 可 用 内 存 有 限时 ， 哈 希 表 不 能 完全 CACHE 到 内 存 。 随 着 满足 连接 条 件 的 结果 集 的 增加 ， 可 用 内 存 会 随 之 下 降 ， 这 时 已 经 CACHE 到 内 存 的 数据 可 能 会 重新 写 回 到 硬盘 去 。 如 果 出 现 这 
种 情况 ， 系 统 的 性 能 就 会 下 降 。 


上 述 过 程 可 概括 为 图 12-3 所 示 形 式 。 


C 开 失 _》 


恋 取 第 2 张 表 


构造 散 列 结构 临时 的 获 列 表 


从 过 1 张 表 使 用 获 列 表 从 第 2 张 
读 取 数据 表 中 查找 匹配 记录 


是 否 有 更 多 第 1 张 人 将 匹配 的 记录 
表 中 的 记录 ? 添加 到 结果 集中 


图 12-3 ” 哈 希 连接 工作 流程 


看 一 个 示例 : 


SQL> select a.dname, b.empno from dept a, emp b where a.deptno = b.deptno; 


// 已 选择 12 行 


| Id | Operation | Name | Rows | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT | | | 7 (15) | 01 1 
|* 1 | HASH JOIN | | | 7 (15) | 01 | 
| 有 TABLE ACCESS FULL| DEPT | | 3 (0) | 01 1 
| 3 1 TABLE ACCESS FULL| EMP | | 3 (0) | 01 1 


下 面 我 们 看 看 哈 希 连接 的 内 部 工作 机 制 ， 这 部 分 会 比较 复杂 。 


2. 工 作 机 制 


类 似 上 面 的 两 种 连接 方式 ， 哈 希 连接 中 对 两 个 数据 源 也 有 一 个 定义 : 一 个 称 为 构建 表 ， 一 个 称 为 探查 表 。 在 执行 哈 希 连接 时 ， 
将 这 部 分 数据 集 转换 为 一 个 存储 器 内 部 的 单 表 散 列 篮 的 等 价 形式 ， 保 存 到 内 存 中 。 当 然 ， 这 里 要 假设 内 存 能 够 放下 这 个 数据 集 。 开 始 


同样 的 散 列 函数 ， 并 查看 是 否 在 存储 器 内 散 列 簇 中 定位 到 一 个 匹配 的 行 。 
行 。not exists 也 是 可 以 的 ， 它 只 不 过 是 等 值 条 件 的 反 向 使 用 而 已 。 


上 面谈 到 了 两 个 表 ， 优 化 器 是 依据 什么 原则 进行 选择 的 


尼 ? 在 这 里 ， 优 化 器 会 估算 两 个 数据 集 的 


| 


利 


内 部 的 散 列 函数 作 


于 构建 表 的 连接 列 ， 产 生 散 列 键 。 数 据 库 


因为 在 连接 列 上 使 


正 是 了 散 列 函数 以 使 散 列 篮 的 数据 随机 分 布 ， 


据 集 的 大 小 进而 会 影响 构建 表 的 选择 。 优 化 器 会 选择 较 小 的 


数据 集 作为 构建 表 。 


Ea 
FD. 


段 外 ， 还 包括 连接 的 字段 。 这 些 字段 都 是 需要 被 读 取 的 ， 因 此 也 


后 去 第 二 个 表 ， 也 就 是 探查 表 的 数据 。 当 读 取 每 一 行 时 ， 在 连接 列 上 应 
因而 只 有 当 连 接 条 件 是 等 值 条 件 的 时 候 散 列 连 接 才能 正常 执 


行 数 和 行 大 小 。 其 中 行 大 小 是 依据 user tab_columns.avg_col len 列 得 到 的 。 这 两 个 参数 直接 影响 到 数 
注意 的 是 ， 行 大 小 并 不 是 所 有 字段 的 长 度 和 ， 而 是 在 查询 中 涉及 的 字段 长 度 和 。 其 中 查询 涉及 的 字段 除了 最 终 显示 的 字 
计算 在 内 。 这 里 还 需要 注意 一 点 ， 上 述 提 到 的 数据 字典 avg_col len 是 通过 dbms stats 包 收集 的 ， 这 也 说 明了 如 果 数 据 库 从 analyze 转 换 到 


dbms stats 包 收集 统计 信息 ， 可 能 会 导致 哈 希 连 接 中 构建 表 的 选择 。 此 外 ， 如 果 在 语句 中 指定 了 ORDERED 提 示 ，FROM 子 句 中 的 第 一 张 表 将 作为 构建 表 。 


哈 希 连接 是 一 个 高 内 存 消耗 的 操作 。 当 连接 中 的 构建 表 能 够 完全 CACHE 到 内 存 时 ， 哈 希 连 接 的 效率 是 最 佳 的 。 此 时 ， 哈 希 连 接 的 成 本 只 是 两 个 表 从 磁盘 读 入 到 内 存 的 成 本 。 但 如 果 过 大 ， 无 法 全 部 


CACHE 到 内 存 时 ， 优 化 器 会 将 这 个 表 拆 分 成 多 个 分 区 ， 再 将 分 区 逐一 CACHE 到 内 存 中 。 当 分 | 


多 。 


下 面 我 们 通过 一 个 详细 的 哈 希 连接 步骤 ， 说 明 一 下 上 述 过 程 。 


区 的 部 分 数 


区 大 小 也 超过 了 可 用 内 存 时 ， 分 


居 会 临时 写 到 磁盘 的 临时 表 空 间 上 。 当 然 ， 此 时 的 效率 会 下 降 很 


1) 计算 构建 表 的 分 区 数 : 分 区 又 称 为 bucket。 决 定 哈 希 连接 的 一 个 重要 
hash area 的 20% 来 存储 分 区 的 头 信息 、 哈 希 位 图 信息 和 哈 希 表 。 因 此 ， 这 个 数字 的 计算 公式 是 : 


Bucket 数 二 0.8*hash_area_size/ (hash_multiblock_io_count*db_block_size) 


素 是 小 表 的 分 区 数 。 这 个 数字 由 hash_area_size、hash_multiblock io_count 和 db_block _size 参 数 共同 决定 。Oracle 会 保留 


2) 哈 希 计算 : 读 取 构 建 表 数据 (简称 为 R) ， 并 对 每 一 条 数据 根据 哈 希 算法 进行 计算 。Oracle 采 用 两 种 哈 希 算法 进行 计算 ， 计 算出 能 达到 最 快速 度 的 哈 希 值 (第 一 哈 希 值 ) 和 第 二 哈 希 值 。 而 关于 这 些 
分 区 的 全 部 哈 希 值 (第 一 hash 值 ) 就 成 为 哈 希 表 。 

3) 存放 数据 到 哈 希 内 存 中 : 将 经 过 哈 希 算法 计算 的 数据 ， 根 据 各 个 bucket 的 哈 希 值 (第 一 hash 值 ) 分 别 放 入 相应 的 bucket 中 。 第 二 hash 值 就 存放 在 各 条 记录 中 。 

4) 创建 哈 希 位 图 : 与 此 同时 ， 也 创建 了 一 个 关于 这 两 个 哈 希 值 映 射 关 系 的 哈 希 位 图 。 

5) 超出 内 存 大 小 部 分 被 移 到 磁盘 : 如 果 hash area 被 占 满 ， 那 最 大 一 个 分 区 就 会 被 写 到 磁盘 (临时 表 空 间 ) 上 去 。 任 何 需要 写 入 到 磁盘 分 区 上 的 记录 都 会 导致 磁盘 分 区 被 更 新 。 这 样 的 话 ， 就 会 严重 影 
响 性 能 ， 因 此 一 定 要 尽量 避免 这 种 情况 。 上 述 几 个 步骤 将 一 直 持续 到 整个 表 的 数据 读 取 完毕 。 

6) 对 分 区 排序 : 为 了 能 充分 利用 内 存 ， 尽 量 存储 更 多 的 分 区 ，Oracle 会 按照 各 个 分 区 的 大 小 将 它们 在 内 存 中 进行 排序 。 

7) 读 取 探 查 表 数 据 ， 进 行 哈 希 匹配 : 接 下 来 开始 读 取 探 查 表 (简称 S$) 中 的 数据 。 按 顺序 读 取 每 一 条 记录 ， 计 算 它 的 哈 希 值 ， 并 检查 是 否 与 内 存 中 的 分 区 的 哈 希 值 一 致 。 如 果 是 ， 返 回 join 数据 。 如 果 
内 存 中 的 分 区 没有 符合 的 ， 就 将 S 中 的 数据 写 到 一 个 新 的 分 区 中 ， 这 个 分 区 也 采用 与 计算 R 一 样 的 算法 计算 出 哈 希 值 。 也 就 是 说 这 些 S 中 的 数据 产生 的 新 的 分 区 数 应 该 和 R 的 分 区 集 的 分 区 数 一 样 。 这 些 新 的 分 


区 被 存储 在 磁盘 (临时 表 空 间 ) 上 。 


8) 完成 探查 表 的 数据 读 取 : 一 直 按 照 上 一 步骤 进行 ， 直 到 大 表 中 的 所 有 数据 读 取 完毕 。 


9) 处 理 没有 join 的 数据 : 这 个 时 候 就 产生 了 一 大 堆 join 好 的 数据 及 从 R 和 S 中 计算 存储 在 磁盘 上 的 分 区 。 


哈 希 函数 计算 出 并 在 内 存 中 创建 哈 希 表 。 采 用 第 二 种 哈 希 函数 的 


10) 二 次 哈 希 计算 : 从 R 和 S 的 分 区 集中 抽取 出 最 小 的 一 个 分 


区 ， 使 用 第 一 和 


11) 二 次 哈 希 匹配 : 在 从 另 一 个 数据 源 (与 hash 在 内 存 的 那个 分 区 所 


12) 完成 全 部 hash join : 继续 按照 二 次 哈 希 处 理 剩 余 分 区 


属 数据 源 不 同 的 ) 中 读 取 分 区 数据 ， 与 内 存 中 的 新 哈 希 表 进行 匹配 。 返 


是 使 数 


原因 


join 数 据 。 


， 直 到 全 部 处 理 完毕 。 


在 上 述 过 程 中 ， 涉 及 多 个 参数 ， 下 面 详细 介绍 这 些 参数 。 


3. 相 关 参 数 


(1) HASH JOIN_ENABLED 


这 个 参数 是 控制 查询 计划 是 否 采 


hash join 的 “总 开关 ” 。 


(2) HASH AREA SIZE 


这 个 参数 控制 每 个 会 话 的 哈 希 内 存 空间 有 多 大 。 它 
保证 sort area 足 够 大 ， 能 容纳 下 整个 小 表 的 数据 。 但 是 


因 


如 果 是 专 有 连接 ， 则 hash area 是 从 PGA 中 分 配 的 。 在 Oracle 9j 及 以 


此 外 ， 还 需 注意 ， 数 据 连 接 方式 不 同 ， 这 块 内存 区 域 存放 位 置 也 不 同 。 


它 可 以 在 会 话 级 和 实例 级 被 修改 。 默 认为 true， 即 可 以 (不 是 一 定 ， 要 看 优化 器 计算 出 来 的 代价 ) 使 
hash join。 当 然 这 里 还 有 一 个 前 提 ， 就 是 hash join 只 有 在 CBO 方 式 下 才 会 被 激活 。 此 外 ，PGA_AGGREGATE_TARGET 设 置 的 足够 大 才 可 以 。 


也 可 以 在 会 话 级 和 实例 级 被 修改 。 默 认 (也 是 推荐 ) 值 是 sort area 空 间 大 小 的 两 倍 (2*SORT_AREA SIZE) 。 
为 每 个 会 话 都 会 开辟 一 个 这 么 大 的 内 存 空间 作为 哈 希 内 存 ， 所 以 不 能 过 大 (一 般 不 建议 超过 2MB) 。 


后 版 本 中 ，Oracle 不 推荐 在 专 有 连接 中 使 用 i 


居 分 布 性 更 好 。 


hash join; 如 果 设 为 false， 则 禁止 


是 高 hash join 的 效率 ， 就 一 定 要 尽量 


哈 希 内 存 ， 而 是 推荐 通过 设置 PGA_AGGRATE_TARGET 参 数 来 自动 管理 PGA 内 存 。 保 留 HASH_AREA_SIZE 只 是 为 了 向 后 兼容 。 如 果 是 共享 连接 ， 则 hash area 是 从 UGA 中 分 配 的 。 


(3) HASH_ MULTIBLOCK IO COUNT 


这 个 参数 决定 了 每 次 读 入 hash area 的 数据 块 数量 。 因 


为 1- (65536/DB_ BLOCK SIZE) 。 


此 它 会 对 I/O 性 能 产生 影响 。 


只 能 在 init.ora 或 spfile 中 修改 。 在 8.0 及 之 前 的 版 本 中 ， 它 的 默认 值 是 1， 在 8i 及 以 


后 的 版 本 中 ， 默 认 值 是 0。 一 般 设置 


(4) WORKAREA SIZE POLICY 


WORKAREA_SIZE_POLICY 是 工作 区 的 配置 策略 ， 有 MANUAL 和 AUTO 两 种 设置 。 


MANUAL: 在 这 种 情况 下 ， 若 内 存 分 配 处 于 最 优 和 一 遍 散 列 连接 之 间 的 边界 附近 时 ， 会 出 现 内 存 增 大 了 ， 但 成 本 却 提高 了 的 情况 。 其 原因 在 于 ，Otacle 从 多 块 IO 〈 竺 大 小 为 9 个 块 ) 切换 到 单 块 


IO (〈 答 大 小 为 1 个 块 ) 。 


“ AUTO: 虽然 启用 CPU 成 本 计算 下 手工 设置 hash_area_size 的 效果 很 好 ， 但 更 具 策 略 性 的 是 将 workarea_size_policy 设 置 为 aato， 并 在 启用 CPU 成 本 计算 的 情况 下 设置 ga_aggregate_target。 这 个 参数 的 设置 直 


接 影响 到 hash_area_size 的 大 小 。 对 于 存在 问题 的 那些 查询 ， 可 以 在 会 话 级 重新 对 内 存 进行 分 配 ， 并 通过 语句 级 谨慎 地 使 用 提示 以 调整 菜 些 访问 路 径 。 


散 列 连接 一 般 归于 工作 区 执行 (workarea exections) 一 类 ， 在 v$sysstat 中 分 为 optimal、onepass、multipass 三 类 。 分 别 代表 以 下 含义 : 


”Optimal 最 优 散 列 连接 : 构建 表 能 够 全 部 放 入 内 存 ， 而 不 是 作为 缓冲 器 中 真正 的 单 表 散 列 禾 。 这 意味 着 通常 存在 于 表 访 问 中 的 锁 存 、 绥 冲 和 读 一 致 性 成 本 ， 在 探查 散 列 表 中 都 不 会 出 现 。 
“ Onepass 一 一 一 遍 散 列 和 连接 : 一 遍 散 列 连接 和 最 优 散 列 连接 ， 主 要 区 别 是 LI/O 成 本 增加 了 很 多 。 成 本 的 差别 主要 是 优化 器 估计 运行 时 会 增加 LI/O 操 作 。 因 为 散 列表 太 大 而 无 法 全 部 读 入 内 存 ， 其 中 的 一 


部 分 必须 转 储 到 磁盘 ， 随 后 再 重新 读 入 。 并 且 探 查 表 中 相似 大 小 的 一 部 分 也 必须 转 储 到 磁盘 ， 此 后 重新 读 入 。 


* Multipass 


4. 优 缺点 


当 连 接 的 两 个 表 是 用 等 值 连接 并 且 表 的 数据 量 比 较 大 时 ， 优 化 器 才 可 能 采用 哈 希 连接 。 哈 希 连 接 适用 于 连接 两 个 大 的 结果 集 或 者 一 大 一 小 两 个 结果 集 。 哈 希 连 接 的 优点 在 于 返回 所 有 其 


小 表 能 够 适合 内 存 时 ， 其 性 能 极其 优越 。 


在 缺少 有 用 的 索引 时 ， 哈 希 连 接 比 谋 套 循环 连接 更 加 有 效 。 哈 希 连 接 可 能 比 嵌 套 循环 连接 快 ， 因 为 处 理 内 存 中 的 哈 希 表 比 检索 B 树 更 加 迅速 。 哈 希 连 接 可 能 比 排序 合并 连接 更 快 ， 因 


他 记录 ， 尤 其 当 


多 遍 散 列 连接 : 数据 被 转 储 到 磁盘 之 后 又 被 多 次 重新 读 取 ， 所 以 这 类 散 列 操作 被 称 为 多 遍 操 作 。 如 果 hash_area_size 太 小 ， 会 出 现 这 种 情况 ， 那 么 执行 大 的 散 列 连接 时 需要 的 I/O 量 会 非常 


为 这 种 情况 下 ， 只 有 


一 张 源 表 需 要 排序 。 在 排序 合并 连接 中 ， 两 张 表 的 数据 都 需要 先 做 排序 ， 然 后 做 MERGE 操 作 ， 因 此 效率 相对 很 差 。 哈 希 连 接 的 效率 最 高 ， 因 为 只 要 对 两 张 表 扫描 一 次 。 在 绝 大 多 数 情况 下 ， 哈 希 连 接 效率 比 


其 他 关联 方式 效率 都 高 。 


当然 ， 哈 希 连 接 也 有 一 些 不 适用 的 情况 。 和 排序 合并 连接 、 和 群集 连接 一 样 ， 哈 希 连 接 只 能 用 于 等 价 连接 。 和 排序 合并 连接 一 样 ， 哈 希 连 接 使 用 内 存 资源 ， 并 且 当 用 于 排序 的 内 存 不 足 时 ， 会 增加 临时 表 


空间 的 MO 成 本 (这 将 使 这 种 连接 方法 速度 变 得 极 慢 ) 。 哈 希 连接 返回 第 一 条 结果 会 慢 ， 因 为 一 个 数据 源 必 须 哈 希 到 内 存 中 或 者 内 存 和 磁盘 中 。 当 请 求 快速 返回 记录 集 时 ，Oracle 倾 向 


5. 两 个 有 趣 的 问题 
(1) 如 何 加 速 哈 希 连接 ? 


如 果 待 连接 的 表 很 大 ， 怎 样 才能 加 速 执行 哈 希 连接 呢 ? 可 参照 下 面 的 做 法 : 


使 


谋 套 循环 。 


alter session set workarea size policy=MANUAL; 

alter session set workarea size policy=MANUAL; 

alter session set db file multiblock read count=512; 

alter session set db file multiblock read count=512; 

alter session set events '10351 trace name context forever, level 128'; 
alter session set hash area size=524288000; 

alter session set hash area size=524288000; 

alter session set " hash multiblock io count"=128; 

alter session set " hash multiblock io count"=128; 

alter session enable parallel query; 


select /*+ pq distribute (a hash, hash) parallel (a) parallel (b) */ column1， column2http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/ 


from source tab a, driving tab b 
where condition; 


(2) HASH 区 域 计算 方法 


在 Oracle 计 算 哈 希 区 域 的 时 候 ， 是 把 SELECT 部 分 和 WHERE 部 分 过 滤 谓 词 字段 都 计算 在 内 的 。 这 里 不 要 忽略 了 WHERE 部 分 ， 虽 然 感 觉 不 太 有 必要 。 此 外 ， 平 时 总 说 hash join 以 小 表 为 BUILD 表 比较 


好 ， 准 确 的 说 法 应 该 是 以 结果 集 的 BYTES 小 的 表 为 BUILD 比较 好 。 下 面 看 一 个 示例 。 


select a.object type, b.object name, b.CREATED 
fromta,tlb 
where a.object id=b.object id and b.STATUS=: 1; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT | |! T6157] S515K| 132 (2) | 00: 00: 02 | 
I* 1 | HASH JOIN | 194153 | S515K| 132 (2) | 00: 00: 02 | 
| -| TABLE ACCESS FULL| T 1 26361 | 258K| 65 《9 | BO: 00: OE | 
| 二 人 ,| TABLE ACCESS FULL| T1 ] i0181 ] 387K| 66 《2 | 00: 00: 0L 1 


SUBOBJECT NAME 
OBJECT ID 
DATA OBJECT ID 
OBJECT TYPE 
CREATED 
LAST_DDL TIME 
TIMESTAME 
STATUS 
TEMPORARY 
GENERATED 
SECONDARY 
NAMESPACE, 
EDITION NAME 


D 


6 
9 
多 
号 
区 
8 
8 
8 
0 
7 
有 
全 
2 
3 
3 


/* 
T1 表 评估 出 来 的 BYTES 为 387K， 看 看 这 个 数值 是 怎么 计算 出 来 的 。 查 询 里 一 共 出 现 了 Tl 表 的 4 个 字段 。 分 别 为 object_name、created、object id、status， 这 四 个 字段 的 长 度 总 和 结果 上 面 的 查询 可 以 知道 为 select 39*101; 
x 
/ 


12.6 ”其 他 连接 方式 


除了 上 述说 明 的 这 几 种 连接 方式 外 ，Oracle 还 支持 其 他 几 种 方式 ， 下 面 摘 主要 的 说 明 一 下 。 


1. 笛 卡 儿 积 


于 笛 卡 儿 连 接 会 导致 性 外 


下 面 看 一 个 示例 。 


第 卡 儿 连接 是 指 在 两 表 连接 没有 任何 连接 条 件 的 情况 下 ， 优 化 器 把 第 一 个 表 的 每 一 条 记录 和 第 二 个 表 的 所 有 纪录 相连 接 。 如 果 第 一 个 表 的 记录 数 为 m， 第 二 个 表 的 记录 数 为 n， 则 会 产生 m*n 条 记录 。 由 
外 很 差 的 SQL， 因 此 一 般 也 很 少 用 到 。 从 广义 角度 来 看 ， 笛 卡 儿 连接 是 M : N 的 连接 。 虽 然 在 执行 计划 中 是 以 “CARTESIAN” 来 表示 笛 卡 儿 连接 ， 但 实际 上 它 是 按照 排序 合并 方式 执 


SQL> select a.*, b. 


| Id | Operation 


* from emp a, dept b; 


| Name | Rows | Bytes | Cost (%CPU) | Time | 


| 0 | SELECT STATEMENT | | 48 | 5616 | 9 (0) | 00: 00: 01 | 
| 1 | MERGE JOIN CARTESIAN| | 48 | 5616 | 9 (0) | 00: 00: 01 | 
| 总 | TABLE ACCESS FULL | DEPT | 4 1 120 | 3 (0) | 00: 00: 01 1 
| 3 1 BUFFER SORT | | 12 | 1044 | 6 (0) | 00: 00: 01 | 
| 4 1 TABLE ACCESS FULL | EMP | 12 | 1044 | 2 (0) | 00: 00: 01 | 


// 注 意 CARTESIAN 字 样 


2. 星 型 连接 


星 型 连接 是 先 对 查询 关联 的 维 表 得 到 的 结果 集 进行 关联 ， 由 于 维 表 过 滤 出 来 的 结果 集 通常 很 小 ， 故 采用 笛 卡 儿 连 接 得 到 的 组 合 也 是 比较 小 的 ; 然后 


实 表 得 到 所 需 的 记录 。 


在 事 


实 表 相 应 的 列 上 创建 组 合 索引 ， 通 过 索引 访问 


SQL> create table 
// 表 已 创建 

SQL> create table 
// 表 已 创建 

SQL> create table 
// 表 已 创建 

SQL> create table 
// 表 已 创建 

SQL> create table 
// 表 已 创建 

SQL> update 七 set 
// 已 更 新 18859 行 
SQL> update t set 
// 已 更 新 18859 行 
SQL> update 七 Set 
// 已 更 新 18859 行 
SQL> alter table 七 
// 表 已 更 改 

SQL> update t set 
// 已 更 新 18859 行 
SQL> commit; 

// 提 交 完 

SQL> create table 
// 表 已 创建 

SQL> alter table 七 
// 表 已 更 改 

SQL> alter table 七 
// 表 已 更 改 

SQL> alter table 七 
// 表 已 更 改 

SQL> insert into tt 
// 已 创建 18859 行 
SQL> insert into t 
// 已 创建 18859 行 
SQL> commit; 

// 提 交 完 

SQL> create index 
// 索 引 已 创建 

SQL> alter session 
/ /会 话 已 更 改 

SQL> select a.obje 


t as select * from dba objects; 
t type as select rownum type id, a.* from (select distinct object type from t) a; 
t owner as select rownum owner id, a.* from (select distinct owner from t) a; 

t status as select rownum status id, a.* from (select distinct status from t) ai 


t_created as select rownum created id, a.* from (select distinct created from t) a; 
object type= (select type id from t type b where t.object type=b.object type) ; 
owner= (select owner id from t_ owner b where t.owner=b.owner) ; 

status= (select status id from t _ status b where t.status=b.status) ; 


add created date int; 


created date= (select created id from t created b where t.created= b.created) ; 


test as select * from t where 1=2; 
est modify status int; 

est modify owner int; 

est modify object type int; 

est select * from t; 


est select * from test; 


idx test on test (owner, object type, created date, status) 


set nls date format="'yyyy-mm-dd hh24: mi: ss'; 


ct_id, a.object name 


2 from test a, t owner b, t type c, t created d, t status e 


3 where a.owner: 
a.object type=c.type id and 
.Created 
.Status=t 
‘OwnNer=" 


a 
a 
b 
c.object 
Q 
e 


=b.owner id and 


| date=d.created id and 


e.status_id and 
SCOTT' and 
type='TABLE' and 


.created="'2005-08-30 15: 06: 10' and 
1 .Status="'VALID'; 
Id Operation Name Rows Bytes | Cost (%CPU) 
0 SELECT STATEMENT 下 225 15 (7) 
和 寺 HASH JOIN 1 225 15 (7) 
2 NESTED LOOPS 1 
本 NESTED LOOPS 207 二 (0) 
4 MERGE JOIN CARTESIAN 1 76 9 (0) 
5 MERGE JOIN CARTESIAN 1 54 6 (0) 
各 三 TABLE ACCESS FULL T_OWNER 30 3 (0) 
7 BUFFER SORT 24 3 (0) 
wi TABLE ACCESS FULL T TYPE 1 24 3 (0) 
9 BUFFER SORT 1 22 6 (0) 
和 TABLE ACCESS FULL T_CREATED 1 22 3 (0) 
让 于 INDEX RANGE SCAN IDx TEST 于 亚 (0) 
12 TABLE ACCESS BY INDEX ROWID| TEST 二 131 2 (0) 
| TABLE ACCESS FULL T_STATUS 下 18 (0) 


3. 索 引 连 接 


索引 连接 是 指 在 某 个 查询 语句 中 用 到 的 某 个 表 列 存在 一 个 以 上 的 索引 时 ， 按 照 哈 希 连接 方式 将 这 些 索 引 连 接 起 来 的 方法 。 也 就 是 说 不 通过 读 取 索引 再 读 取 表 的 方式 ， 而 是 只 通过 索引 连接 来 实现 数据 查 
询 的 方法 。 由 于 哈 希 连 接 只 能 通过 ROWID 来 实现 索引 连接 ， 所 以 只 要 能 够 从 索引 中 获得 ROWID 并 将 其 提供 给 哈 希 连 接 就 可 以 实现 索引 连接 的 目的 。 


这 种 连接 方式 在 合适 的 列 (满足 整个 查询 的 列 ) 上 建立 索引 ， 这 样 就 可 以 确保 优化 器 将 索引 连接 作为 可 选项 之 一 。 相 对 于 快速 全 局 扫描 ， 连 接 扫描 的 优势 在 于 ， 快 速 全 局 扫描 只 有 一 个 单一 索引 满足 整 


个 查询 ， 索 引 连 接 可 以 有 多 个 索引 满足 整个 查询 。 


索引 与 表 相 比 不 仅 相对 较 小 ， 而 且 在 扫描 时 能 够 只 对 有 用 的 部 分 进行 扫描 ， 因 此 可 以 看 出 索引 具有 其 独特 的 优点 。 在 存在 多 个 索引 的 情况 下 ， 比 较 有 效 的 方法 是 从 中 选择 一 个 最 能 缩减 查询 范围 的 条 件 


作为 驱动 查询 条 件 来 使 


可 以 通过 INDEX JOI 
选择 索引 连接 。 


下 面 看 一 个 示例 。 


， 而 其 他 查询 条 件 则 作为 过 滤 条 件 来 使 用 。 应 尽 最 大 的 努力 创建 出 一 个 最 有 效 的 索引 ， 若 是 在 无 法 实现 的 情况 下 ， 也 只 能 通过 合 
询 范 围 的 目的 了 ， 此 时 索引 合并 也 算 比 较 有 效 的 方法 了 。 由 于 无 法 通过 ROWID 读 取 数据 的 谋 套 循环 方式 来 实现 索引 合并 ， 因 


并 多 个 拥有 相似 查询 范围 的 索引 来 共同 实现 缩减 查 
此 只 能 通过 合并 或 哈 希 连 接 的 方式 来 实现 索引 合并 了 。 


N 提 示 ， 促 使 优化 器 选择 索引 连接 。 此 外 ， 还 有 一 个 隐 含 参数 index join_enabled， 这 个 参数 默认 值 为 true， 而 且 通 过 成 本 计算 判断 索引 连接 是 有 效 的 数据 处 理 方法 ， 优 化 器 才 会 


SQL> create table t as Select * from dba objects; 


// 表 已 创建 


SQL> create index idx 1 on t (owner， object_name) 


// 索 引 已 创建 
SQL> create index idqx 2 on t (object type, object id) ; 
// 索 引 已 创建 
SQL> select /*+ index join (t) 
2 fromt 
3 where owner='SYS' and object type="'VIEW'; 


*/ object name, object id 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 

| 0| SELECT STATEMENT | | 2912| 304K| 5 (20) | 00: 00: 011 
I* 1| VIEW | index$ join$ 001 | 29121 304K| 5 《20) { 00: 00: 011 

|* 2| HASH JOIN | | | 1 | | 

| 才 要 | INDEX RANGE SCAN | IDX 1 | 2912| 304K| 2 (0) | 00: 00: 011 
I* 4| INDEX RANGE SCAN | IDX 2 | 2912| 304K| 2 (0) | 00: 00: 011 
// 通 过 两 个 索引 的 哈 希 连接 ， 完 成 结果 的 查询 


第 13 章 ，” 半 连接 与 反 连 接 


半 连 接 、 


连接 是 Oracle 支 持 的 两 种 连接 方式 。 


13.1 ” 半 连 接 

从 广义 角度 来 讲 ， 半 连接 (SEMI JOIN) 就 是 指 主 查 询 与 子 查 询 之 间 使 F 
半 连 接 中 的 子 查询 可 以 引用 主 查询 的 任意 列 ， 反 之 则 不 成 立 。 普 通 表 连接 与 半 连 接 的 
两 个 集合 所 具有 的 是 从 EF 


状态 下 的 两 个 集合 中 的 任何 列 。 对 于 半 连 接 而 言 ， 子 查询 可 以 随意 使 用 主 查 询 的 任意 列 ， 但 主 查 询 不 能 


在 最 开始 的 时 候 ，Oracle 是 使 


谋 套 循环 的 方式 来 处 理 半 连接 的 ， 后 来 优化 器 进化 为 可 以 采 / 


1. 谋 套 循 环 


子 查询 的 列 。 


使 


吝 套 循环 处 理 半 连接 ， 就 是 通过 子 查 询 对 主 查询 数据 进行 过 滤 。 这 里 根据 子 查 询 的 作 


“ 提供 者 : 所 谓 提供 者 是 指 子 查询 被 优先 处 理 ， 子 查询 的 连接 列 都 会 变 成 常量 。 这 些 常量 会 在 主 查询 


中 过 滤 数 据 。 


排序 合并 或 者 哈 希 连接 的 方式 处 理 半 连 接 。 下 | 


HI 


属性 ， 不 存在 从 


的 表 连 接 。 在 半 连 接 中 ， 两 个 查询 是 有 主 次 关系 的 ， 或 者 说 两 者 不 是 平等 的 ， 这 与 普通 的 表 连 接 是 不 同 的 。 从 使 
区 别 在 于 集合 间 的 从 属性 上 。 对 于 表 连 接 而 言 ， 两 个 集合 具有 平等 的 


角度 来 说 ， 


属 关系 ; 但 对 于 子 查询 而 言 ， 


属 关系 。 表 连接 的 问题 的 关键 就 在 于 是 平等 关系 还 是 非 平 等 关系 ， 集 合 之 间 的 交换 定律 是 否 成 立 。 两 者 在 所 涉及 的 列 的 继承 性 上 存在 差异 。 对 于 表 连 接 而 言 ， 可 以 随意 使 


处 于 连接 


通过 几 个 案例 说 明 一 下 各 种 情况 。 


， 可 以 有 两 种 不 同 的 处 理 策略 ， 一 般 把 它们 称 为 提供 者 和 检验 者 。 


“ 检验 者 : 所 谓 检验 者 是 指 主 查询 被 优先 处 理 ， 主 查询 的 连接 列 都 变 成 常量 。 这 些 常 量 会 作为 结果 提供 给 予 查询 ， 子 查询 对 主 查询 结果 进行 检验 。 


下 面 我 们 看 看 示例 。 

SQL> create table emp as select * from scott.emp; 

// 表 已 创建 

SQL> create table dept as select * from scott.dept; 

// 表 已 创建 

SQL> select /*+ ordered use nl (emp, dept) */ * from emp where deptno in (select deptno 
| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT 上’ 1 12 3200 1 8 《L3) 1 OQ: 600 O01 |] 
| 1 | NESTED LOOPS 上’ 1 12 | T2001 8 #13) 1 00: QO: O01 1 
| 艺 ] SORT UNIQUE | | 4 1 52 | 3 (0) | 00: 00: 01 | 
| 3 1 TABLE ACCESS FULL| DEPT | 4 1 52 | 3 (0) | 00: 00: 01 | 
Il* 4| TABLE ACCESS FULL | EMP | 攻击 261 | 2 (0) | 00: 00: 01 | 


from dept) ; 


下 面 看 另外 一 个 例子 。 


SQL> select outer.* 
2 from emp outer 
3 where outer.sal > 
4 【《 
5 select /*+ no unnest */ avg (inner.sal) 
6 from emp inner 
where inner.deptno = outer.deptno 
8 


| Id | Operation Name | Rows | Bytes | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT | 11 | 6 (0) | 00: 00: 01 | 
I* 1 | FILTER | | | | | 

| | TABLE ACCESS FULL EMP | 12 | 1044 | 3 (0) | 00: 00: 01 | 
| 入 |] SORT AGGREGATE 1 | 26 | | 

I 过 入 二 TABLE ACCESS FULL| EMP | | 26 | 3 0) | 00: Q0: 01 | 


在 这 个 示例 中 ， 优 化 器 选择 使 


了 一 种 特殊 的 谋 套 循环 一 一 FILTER。 这 里 没有 优先 处 理子 查询 ,是 


为 在 子 查询 中 引 


及 二 


查询 列 仍然 还 是 未 知 数 ， 所 以 即使 试图 


句 中 ， 子 查询 时 作为 “检验 者 ”的 角色 。 


是 以 主 查 询 的 整体 执行 结果 集 为 对 象 执行 连接 的 ， 而 是 只 与 本 


了 主 查询 (where inner.deptno=outer.deptno) 。 在 主 查询 被 执行 之 前 ， 由 于 
优先 执行 子 查询 ， 它 也 不 具备 被 优先 执行 的 条 件 。 从 某 种 程度 来 讲 ， 这 种 做 法 是 有 意 将 连接 条 件 的 状态 改 为 异常 ， 以 确保 子 查询 放 在 3 


查询 之 后 进行 。 在 这 个 语 


为 了 维护 主 查询 集合 类 型 的 完整 性 ， 优 化 器 在 创建 执行 计划 时 特意 将 NESTED LOOPS 换 为 FILTER。FILTER 方 式 虽 然 与 NESTED LOOPS 方 式 的 处 理 方法 相同 ， 但 是 在 执行 连接 的 时 候 ，FILTER 方 式 并 不 


行 连接 ， 所 以 可 确保 主 查询 集合 类 型 不 被 破坏 。 


复出 现 元 素 中 的 第 一 个 元 素 进 行 连接 的 。 不 论 子 查询 的 执行 结果 集合 中 不 唯一 的 元 素 重 复 多 少 次 ， 该 方式 始终 只 


对 征 


复元 素 中 的 第 一 个 元 素 进 


@@ 说 后 面 示例 中 走 的 就 是 这 种 “过 滤 型 半 连 接 ”形式 ， 在 试图 执行 连接 的 时 候 ， 一 旦 遇 到 满足 条 件 的 行 就 立刻 结束 操作 ; 而 在 谋 套 循环 连接 中 ， 会 对 所 有 满足 条 件 的 行 执行 连接 操作 。 


2. 哈 希 连 接 


在 Oracle 较 新 的 版 本 中 ， 倾 向 


使 用 哈 希 连接 的 方式 处 理 半 连接 。 这 主要 是 因为 采取 谋 套 循环 这 种 过 渡 方 式 处 理 时 ， 主 : 


合 能 够 被 全 部 读 入 内 存 中 ， 则 能 实现 局 部 范围 扫描 。 此 时 ， 即 使 处 理 的 数据 非常 多 ， 也 能 确保 非常 快 的 执行 速度 。 


跟 普通 的 哈 希 连接 有 局 限 性 类 似 ， 哈 希 半 连 接 也 有 一 些 限制 条 件 。 如 在 查询 中 只 能 使 


一 个 表 ， 只 能 使 


是 以 随机 方式 为 主 的 数据 读 取 ， 当 面 


临海 量 数据 时 ， 性 能 很 差 。 如 果 某 一 边 的 


GROUP BY、CONNECT BY、ROWNUM 等 限制 条 件 。 


SQL> select * from emp where deptno in (select deptno from dept) ; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
0 | SELECT STATEMENT | | 12 | 1200 | 
1 | HASH JOIN SEMI 1 | 12 | 1200 | 
人 TABLE ACCESS FULL| EMP | 12 | 1044 | 
:| TABLE ACCESS FULL| DEPT | 4 1 52 | 


// 还 是 上 面 的 示例 ， 只 不 过 没有 提示 ， 这 里 看 到 优化 器 选择 为 哈 希 连接 ， 


意 关 键 字 为 HASH JOIN SEMI 


3 排序 合并 连接 


在 某 些 情况 下 ， 优 化 器 也 会 考虑 使 用 排序 合并 的 方式 来 处 理 。 主 要 是 当 连 接 条 件 的 状态 为 异常 或 所 要 连接 的 数据 量 非常 多 时 。 下 面 我 们 看 个 示例 


SQL> select * from emp where exists (select /*+ merge sj */ 'x' from dept where dept.deptno=emp.deptno) ; 


| Id | Operation | Name 

| 0 | SELECT STATEMENT 1 

| 1 1 MERGE JOIN SEMI 1 

| 21 TABLE ACCESS BY INDEX ROWID| EMP 

[: -1 INDEX FULL SCAN | IDX EMP DEPTNO 
I* 4 | SORT UNIQUE | 局 

| “于 | INDEX FULL SCAN | IDX_DEPT DEPTNO 


在 示例 中 使 用 了 提示 ， 强 行 指定 使 用 排序 合并 半 连 接 。 在 执行 计划 中 ， 可 见 在 对 子 查 询 部 分 的 执行 中 ， 进 行 了 SORT UNIQUE， 其 目的 是 为 了 使 子 查询 唯一 ， 即 子 查询 为 唯一 元 素 集 合 。 由 于 按照 排序 
合并 连接 方式 进行 连接 的 时 候 ， 不 能 对 从 其 他 集合 中 获得 的 结果 直接 进行 连接 ， 只 有 等 到 双方 充分 地 缩减 了 查询 范围 后 才 会 比较 有 效 。 因 此 充分 地 缩减 了 查询 范围 也 就 意味 着 充分 地 缩减 了 随机 读 取 的 次 


4.IN/EXISTS 区 别 


使 用 IN 比较 运算 符 的 主 查询 与 子 查询 之 间 的 连接 列 清晰 可 见 ， 而 在 使 用 EXISTS 的 情况 下 ， 无 论 是 在 主 查询 中 ， 还 是 在 子 查询 的 SELECT-List 中 都 看 不 到 连接 列 ， 最 终 的 连接 条 件 放 在 子 查询 的 WHERE 
处 。 就 像 表 连接 的 描述 方法 一 样 ， 如 果 在 子 查询 中 使 用 了 主 查 询 的 列 ， 则 子 查询 就 失去 了 被 优先 执行 的 条 件 。 因 此 ， 无 论 在 什么 情况 下 ， 只 要 是 使 用 EXISTS 的 半 连 接 ， 子 查询 始终 都 只 能 扮演 检验 者 的 角 
色 。 


此 外 ，EXISTS 并 不 是 比较 运算 符 ， 而 是 判断 满足 与 否 的 布尔 函数 。 在 该 过 程 中 不 需要 对 满足 查询 条 件 的 全 部 数据 进行 判断 ， 只 需要 利用 一 个 证 据 实现 对 整 行 数据 以 及 某 个 列 值 的 所 有 相同 值 的 判定 。 


13.2 ” 反 连 接 


反 连 接 (ANTI JOIN) ， 通 俗 理解 就 是 从 一 个 表 中 返回 不 在 另 一 个 数据 源 中 的 数据 行 ， 常 见 的 情况 有 NOT IN、NOT EXISTS、OUTER JOIN 等 情况 。 和 半 连 接 类 似 ， 对 反 连 接 的 处 理 也 可 采用 谋 套 循 
环 、 排 序 哈 并 、 哈 希 连 接 等 多 种 方式 。 一 般 情 况 下 ， 优 化 器 会 倾向 于 采用 哈 希 连接 的 方式 进行 处 理 ， 特 别 在 较 新 的 版 本 中 。 下 面 看 几 个 示例 。 


create table t1 (coll number, col2 varchar2 (1) not nul1) ; 
create table t2 (col2 varchar2 (1) , col3 varchar2 (2) not nul1) ; 
insert into tl values (1, 'A'); 

insert into tl values (2, 'B'); 

insert into tl1 values (3, 'C'); 

insert into tl1 values (4, 'D'); 

insert into tl values (5, 'E'); 

insert into t2 values ('A', 'A2'); 

insert into t2 values ('B', 'B2') ; 


insert into t2 values ('C', 'D2'); 
insert into t2 values ('D', 'E2') ; 
commit; 


select * from tl] where col2 not in (select col2 from t2 where col3='A2') ; 


Id Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
0 SELECT STATEMENT | | 二 100 | 4 (Ls5) | 0 00+ OL 1 
业主 HASH JOIN ANTI | | -| 100 | 7 | 
2 TABLE ACCESS FULL| T1 | 是 :| | 3 (0 D0: 006 dL 
起 : 洁 TABLE ACCESS FULL| T2 | 二 | 3 (0) | 00: 00: 01 | 


// 默 认 采 用 了 哈 希 反 连 接 (HASH JOIN ANTI) 的 方式 处 理 
select * from tl where col2 not in (select /*+ merge aj */ col2 from t2 where col3='A2') ; 


Id Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
0 SELECT STATEMENT | 1 51 100 | 8 (25) | 00: 00: 01 | 
1 MERGE JOIN ANTI | | | 100 | 8 (25) | 00: 00: 01 | 
效 SORT JOIN | | | 4 (25) | 00: 00: 01 | 
| TABLE ACCESS FULL| T1 | | | 3 (0) | 00: 00: 01 | 
* 4 SORT UNIQUE | 1 | | 4 “25) { O00: Q0: O01 ] 
才 与 TABLE ACCESS FULL| T2 | 11 | 3 (0) | 00: 00: 01 | 


// 通 过 使 用 MERGE_AJ， 强 制 使 用 了 排序 合并 反 连 接 (MERGE JOIN RNTI) 来 处 理 


select * from tl where col2 not jn (select /*+ nl aj */ col2 from t2 where col3='A2') ; 


Id Operation | Name | Rows | Bytes Cost (%CPU) | Time | 
0 SELECT STATEMENT | | :| 100 12 (0) | 00: 00: 01 | 
1 NESTED LOOPS ANTI | | | 100 12 (Dy | D0 Dr dL } 
2 TABLE ACCESS FULL| T1 | 5 中 2 | (0) | 00: 00: 01 | 
才 “ 迄 TABLE ACCESS FULL| T2 : 二 号 2 (0) | 00: 00: 01 | 


// 通 过 使 用 NL AJ， 强 制 使 用 了 赃 套 循环 反 连 接 (NESTED LOOPS ANTI) 来 处 理 


上 面 示 例 使 用 了 NOT IN， 下 面 看 看 针对 NOT EXISTS、 外 连接 等 情况 ， 是 否 可 以 使 用 反 连 接 操作 。 第 一 个 示例 是 使 用 NOT EXISTS。 


SQL> select * from dept where not exists ( select null from emp where emp.deptno 


| Id | Operation | Name | Rows | Bytes Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT | | 4 1 172 3 (Ly | O00: 00F OL | 
I* 1 | HASH JOIN ANTI | | ;| 7 这 7 | 
| 艺 | TABLE ACCESS FULL| DEPT | 4 1 120 3 oy | D0 DO OL | 
| :| TABLE ACCESS FULL| EMP | bp 156 | (0) | 00: 00: 01 | 


第 二 个 示例 是 使 用 外 连接 。 


SQL> select dept.* from dept, emp where dept.deptno=emp.deptno (+) and emp.rowid i 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 


| 0 | SELECT STATEMENT | | | 220 | T 《15) 1 0: 00: |] 
I* 1 | FILTER | | 1 | | | 
| HASH JOIN OUTER | | 4 1 220 | 了 人 5) { 90: Q0: 01 | 
| | TABLE ACCESS FULL| DEPT | 41 120 | 村 (0) | 00: 00: 01 

| 4 1 TABLE ACCESS FULL| EMP | | 300 | 3 (0) | 00: 00: 01 | 


当 使 用 NOT IN 时 ， 如 果子 查询 中 返回 的 列表 中 包含 空 值 ， 可 能 会 带 来 一 些 异 常情 况 。 下 面 看 一 个 示例 。 


SQL> select * from dual where 2 not in (select 1 from dual) ; 
D 


x 
SQL> select * from dual where 2 not in (select 1 from dual union all select null from dual) ; 
no rows selected 


/* 这 里 很 奇怪 ， 从 现 有 条 件 上 看 ，where 部 分 是 满足 条 件 的 ， 但 是 却 没有 返回 记录 ， 其 原因 就 是 子 查询 返回 的 列表 中 包含 空 值 。 针 对 这 种 问题 ， 常 见 的 策略 就 是 在 子 查询 部 分 加 上 非 空 条 件 


此 外 ， 反 连接 使 用 的 字段 可 为 空 时 ， 优 化 器 处 理 起 来 也 有 一 定 问题 ， 这 个 在 较 新 的 版 本 中 已 经 有 所 考虑 ， 但 在 10g 及 以 前 的 版 本 仍然 有 这 个 问题 。 下 面 看 一 个 示例 。 


SQL> select * from dept where deptno not in (select deptno from emp) ; 


0 | SELECT STATEMENT | | 
1 | HASH JOIN ANTI NA | | 
交 TABLE ACCESS FULL| DEPT | 
3 1 TABLE ACCESS FULL| EMP | 


/* 这 种 情况 下 ， 使 用 一 种 特殊 的 哈 希 连接 。 因 为 DEPTNO 字 段 是 可 为 空 的 


SQL> alter session set " optimizer null aware antijoin"=false; 
/ /会话 已 更 改 
SQL> select * from dept where deptno not in (select deptno from emp) ; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT | 革 | 3 (0) | 00: 00: 01 | 
I* 1 | FILTER | | | | 
| 2 1 TABLE ACCESS FULL| DEPT | 4 1 120 | 3 (0) | 00: 00: 01 | 
[| TABLE ACCESS FULL| EMP | | 143 | 2 (0) | 00: 00: 01 | 
// 果 然 ， 这 里 改 用 了 FILTER 型 的 嵌 套 循环 
一 
第 14 章 排序 
排序 操作 是 数据 库 中 比较 消耗 资源 的 一 类 操作 ， 也 是 优化 的 重点 。 在 深入 讲解 排序 之 前 ， 我 们 先 来 看 看 哪些 操作 可 能 带 来 排序 动作 。 


14.1 引发 排序 的 操作 


可 能 引发 排序 的 操作 有 很 多 ， 并 不 是 简单 的 ORDER BY 会 引发 排序 。 下 面 来 看 看 哪些 操作 可 能 引起 排序 操作 以 及 采取 何 种 措施 能 尽量 减少 排序 。 


1. 创 建 索引 


这 个 很 容易 理解 ， 索 引 是 个 有 序 的 结构 ， 创 建 索 引 肯 定 需 要 将 索引 值 排序 后 才能 建立 索引 。 如 果 在 创建 索引 时 就 知道 某 个 索引 列 是 升序 的 预先 排 过 序 或 递增 插入 ) ， 则 可 以 在 索引 建立 时 使 
NOSORT 字 句 ， 消 除 索引 建立 的 排序 动作 。 


2. 某 些 SQL 


带 有 DISTINCT、ORDER BY、GROUP BY、UNION、MINUS、INTERSET、CONNECT BY 和 CONNECT BY ROLLUP 子 句 的 查询 。 对 于 ORDER BY、CONNECT BY、GROUP BY 和 CONNECT BY 
ROLLUP 子 句 等 ， 服 务 器 进程 要 对 子 句 中 指定 的 值 或 条 件 进行 排序 。 对 包括 DISTINCT 或 UNION、INTERSET、MINUS 的 查询 ， 服 务 器 进程 要 清除 重复 值 。 对 于 这 些 语句 的 使 用 ， 要 尽量 控制 ， 对 它 因 为 排 
序 可 能 带 来 的 成 本 增加 有 所 估计 。 有 些 不 必要 的 需求 ， 可 以 转换 写法 ， 例 如 对 结果 集 不 需要 去 重 的 话 ， 就 可 以 使 用 UNION ALL 代 蔡 UNION。 此 外 ， 对 于 类 似 ORDER BY 的 部 分 ， 可 以 利用 索引 的 有 序 结 
构 ， 避 免 排序 。 对 于 主键 字段 的 访问 ， 也 不 需要 DISTINCT、UNIQUE， 因 为 其 本 身 就 是 唯一 的 。 


10g 以 前 ， 由 于 算法 特点 ，group by 的 结果 集 是 自动 排序 的 。 但 10g 之 后 ， 由 于 Oracle 提 供 了 默认 的 Hash Group by 算法 ， 该 算法 不 保证 结果 集 排 序 了 。 如 果 希 望 使 用 性 能 更 好 的 Hash Group by 算 
法 ， 又 希望 结果 集 是 排序 的 ， 则 需要 在 语句 中 增加 ORDER BY 语句 。 如 果 不 想 修改 语句 ， 又 需要 结果 集 排序 ， 则 可 以 通过 Oracle 一 个 内 部 参数 (_gby_hash_aggregation_enabled=false) 关闭 Hash 
Group by 算法 。 


3 排序 合并 连接 


如 果 查 询 两 个 或 多 个 表 的 等 值 连接 请 求 时 没有 发 现 索引 ， 则 服务 器 进程 会 进行 排序 合并 连接 。 如 果 优化 器 选择 排序 合并 ， 则 服务 器 进程 要 对 每 个 表 进 行 全 表 扫 描 ， 按 连接 列 的 值 分 别 排序 每 个 表 ， 然 后 
根据 条 件 中 的 值 合 并 表 。 如 果 执 行 关联 查询 的 表 的 连接 列 是 存在 索引 的 ， 则 可 不 需要 排序 环节 ， 这 样 可 大 幅度 提升 性 能 。 


4 收集 统计 信息 


对 于 统计 动作 ， 能 干预 的 不 多 ， 只 能 尽量 减少 收集 范围 。 只 对 那些 在 连接 条 件 中 使 用 的 列 生成 统计 信息 。 对 于 主键 或 唯一 约束 的 列 ， 则 不 需要 生成 直方 
排序 空间 ， 故 应 改 用 estimate。 此 外 ，compute 还 会 锁 住 表 。 注 意 ， 如 果 指 定 表 50% 以 上 用 于 统计 信息 ， 则 estimate 的 行为 和 compute 差 不 多 。 


。 此 外 ，compute 统 计 信息 时 ， 需 要 用 更 多 的 


[ 


5. 其 他 情况 


其 他 情况 主要 包括 B 树 到 位 图 的 变换 、 分 析 函 数 等 。 对 于 位 图 转换 类 的 查询 ， 可 尽量 从 结构 设计 角度 去 优化 ， 对 于 分 析 函 数 ， 也 可 考虑 在 应 用 端 进 行 处 理 。 


14.2 ”避免 和 减少 排序 


索引 是 一 个 很 消耗 资源 的 操作 ， 那 么 如 何 避 免 或 者 减少 排序 就 成 为 我 们 需要 考虑 的 问题 ， 或 者 说 是 日 常 优化 的 一 个 重要 方向 。 


14.2.1 ”优化 原则 及 基本 方法 


针对 上 面 那些 可 以 引发 排序 的 操作 ， 可 以 通过 一 些 方法 来 尽量 减少 甚至 避免 排序 。 我 们 的 基本 原则 就 是 能 不 排序 就 不 要 排序 。 用 户 需要 明确 是 否 真 的 需要 排序 结果 ， 哪 些 操作 是 需要 排序 的 ， 哪 些 操作 
是 隐 含 进行 排序 的 。 尽 量 利用 索引 这 种 排序 结构 ， 只 要 查询 字段 都 在 索引 中 ，Oracle 会 自动 选择 索引 扫描 执行 计划 来 避免 排序 ， 这 样 可 以 省 去 排序 操作 。 如 果 必 须要 排序 ， 也 尽量 控制 排序 大 小 ， 将 需要 排 
序 的 数据 装载 到 内 存 中 ， 减 少 磁盘 /O 次 数 ， 以 达到 优化 的 目的 。 下 面 看 一 看 优化 的 基本 原则 : 


NOSORT 索 引 : 如 果 要 检索 的 列 值 是 升序 (预先 排序 或 递增 插入 ) ， 则 可 以 在 索引 建立 时 使 用 NOSORT 子 句 ， 消 除 索引 建立 的 排序 阶段 。 
: UNION ALL 而 不 是 UNION: UNION ALL 子 句 并 不 消除 重复 项 ， 因 此 查询 阶段 不 需要 排序 。 


“ 表 连 接 使 用 索引 访问 : 排序 合并 连接 ， 需 要 全 表 扫 描 和 一 个 排序 合并 结果 集 。 基 于 索引 访问 的 谱 套 循环 连接 ， 可 以 减少 全 表 扫 描 和 消除 排序 ， 从 而 提高 性 能 。 


“ 对 ORDER BY 子 句 引用 的 列 生成 索引 : 对 经 常 在 ORDER BY 子 句 中 引用 的 列 生成 索引 ， 这 样 Oracle 用 索引 提供 顺序 ， 而 不 是 进行 排序 。 


主键 选择 : 主键 的 select， 不 需要 distinct 和 unique 子 句 ， 因 为 主键 本 身 唯一 。 


: 选择 要 分 析 的 特定 列 : 只 对 要 在 连接 条 件 中 使 用 的 列 生成 统计 信息 ， 使 用 analyzehttp:/ /www.hzcourse.com/resource/readBook?path=/openresources/teach_ebook/uncompressed/15654/OEBPS/Text/...for all 
indexed columns 或 analyzehttp://www.hzcourse.com/resource/readBook?path=/openresources/teach_ebook/uncompressed/15654/OEBPS/Text/...for columns 等 等 。 另 外 ， 具 有 主键 或 唯一 约束 的 列 ， 不 需要 产生 直方 


图 。 


: 用 estimate 而 不 是 compute: 这 部 分 前 边 介绍 过 ( 见 14.1 节 ) ， 这 里 就 不 重复 了 。 


14.2.2 ”避免 排序 的 示例 


下 面 我 们 通过 几 个 示例 ， 看 看 如 何 避 免 排序 ， 提 高 效率 。 


1. 使 用 索引 避免 排序 


下 面 看 一 个 使 用 索引 避免 排序 的 示例 。 


SQL> create table t nosort (id number primary key, name varchar2 (30) not nul1) ; 
Table created. i 

SQL> create index ind t nosort name on t nosort (name) ; 

Index created. 

SQL> insert into t nosort select rownum, table name from dba tables; 

2817 rows created. 

SQL> commit; 

Commit complete. 

SQL> select id, name from t nosort order by name; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT 1 | 2817 | 84510 | 6 (17) | 00: 00: 01 | 
| 1 | SORT ORDER BY | | 2817 | 84510 | 6 (17) | 00: 00: 01 | 
| | TABLE ACCESS FULL| T NOSORT | 2817 | 84510 | 5 OY | O05 DO LE | 


sorts (remory) 
0 sorts (disk) 显然 此 时 有 排序 动作 


SQL> select /*+ index (t nosort ind t nosort name) */ id, name from t nosort order by name; 


0 | SELECT STATEMENT | | 
| 1 | TABLE ACCESS BY INDEX ROWID| T NOSORT | 
2 | INDEX FULL SCAN | IND T NOSORT NAME | 


0 sorts (memory) 
0 sorts (disk) 
i 了 索引 全 扫描 ， 可 以 避免 排序 。 如 果 是 倒 排 序 (order by desc) ， 可 以 使 用 index desc 提 示 利 用 索引 扫描 避免 排序 


2. 通 过 包含 连接 的 查询 避免 排序 


排序 合并 连接 的 连接 方式 由 于 是 先 排序 后 连接 ， 因 此 查询 的 结果 本 身 就 是 包含 排序 的 。 我 们 可 以 利用 这 一 点 避免 一 些 排序 的 发 生 。 下 面 看 一 个 示例 。 


SQL> create table tl (id number primary key, name varchar2 (30) not nul1) ; 
Table created. 
SQL> create table t2 (id number， name varchar2 (30) ) ; 
Table created. 
SQL> create index ind tl name on tl (name) ; 
Index created. 
SQL> insert into tl select rownum, table name from dba tables; 
2817 rows created. 二 
SQL> insert into t2 select rownum, object name from dba objects; 
86479 rows created. 
SQL> commit; 
Commit complete. 
SQL> select /*+ use merge (t1， t2) */ t2.name, t1.id 
人 
3 where tl.name = t2.name; 


| Id | Operation Name Rows | Bytes |TempSpc| Cost (%CPU) | Time | 
| 0 | SELECT STATEMENT 24351 | 1117K]| | 602 | 
| 1 | MERGE JOIN 24351 | 1117K| | 602 (1) | 00: 00: 08 | 
| 将] SORT JOIN 2817 | 84510 | | 6 (17) | 00: 00: 01 | 
| 等 -| TABLE ACCESS FULL 
WE 2817 | 84510 | | 5 《0 1 00: 002 OE 1 
| 观 ] SORT JOIN 83037 | 1378K| 3928K| 596 CO G0 | 
| 5 | TABLE ACCESS FULL 
T2 83037 | 1378KI | 136 0) { O00: os 02 1 
Statistics 
2 sorts (memory) 
0 sorts (disk) 
// 因 此 ， 如 果 指 定 排序 为 连接 列 的 升序 排列 ， 则 使 用 MERGE JOIN 可 以 避免 排序 的 产生 


SQL> select /*+ use _ merge (t2, tl1) */ t2.name, tl.id 
2 rnt 
3 where tl.name = t2.name 
4 order by t2.name; 


| SELECT STATEMENT | 
| MERGE JOIN | 
| SORT JOIN | 
| TABLE ACCESS FULL| T1 
| SORT JOIN | 
| TABLE ACCESS FULL| T2 | 


// 但 是 MERGE JOIN 只 能 对 连接 列 排序 ， 且 排序 操作 只 能 是 升序 ， 对 于 降序 MERGE JOIN 却 无 能 为 力 


由 于 NESTED LOOP 操 作 本 身 不 包含 排序 ， 因 此 NESTED LOOP 也 不 会 保证 结果 是 排 过 序 的。 但 是 NESTED LOOP 可 以 保证 连接 过 程 是 稳定 的 。 也 就 是 说 ， 如 果 驱 动 表 在 连接 之 前 是 排 了 序 的 ， 那 么 经 过 


连接 之 后 ， 得 到 的 结果 也 是 排 了 序 的 。 下 面 看 一 个 示例 。 


SQL> create index ind t2 id on t2 (id) ; 

Index created. 

SQL> create index ind t2 name on t2 (name) ; 

Index created . ly 

SQL> select /*+ use nl (tl, t2) */ tl.id， tl.name, t2.name 
2 rem ti 区 
3 where tl.id = t2.id; 


| SELECT STATEMENT | | 
| NESTED LOOPS | | 
1 NESTED LOOPS | | 
| TABLE ACCESS FULL [Bw | 
| INDEX UNIQUE SCAN | SYS_C0011220 | 
| TABLE ACCESS BY INDEX ROWID| T1 | 


/* 现 在 得 到 的 结果 不 是 按照 T1 的 NAME 列 进行 排序 的 ， 但 是 如 果 把 T1 作 为 驱动 表 ， 且 访问 T1 的 时 候 就 按照 NAME 的 顺序 访问 ， 那 么 得 到 的 最 终结 果 也 是 按照 T1 的 NAME 进 行 排序 的 
a 


SQL> select /*+ ordered index (tl ind tl1 name) use nl (tl, t2) */ ti.id, til.name, t2.name 
2， 于 rom 七] 不 2 
3 where tl.id = t2.id 
4 order by tl.name; 


| Id | Operation | Name | 

| 0 | SELECT STATEMENT | | 

| 1 1 NESTED LOOPS | | 

| 2 1 NESTED LOOPS | | 

[| 3] TABLE ACCESS BY INDEX ROWID| T1 | 

| 于] INDEX FULL SCAN | IND T1 NAME | 

lx 51 INDEX RANGE SCAN | IND T2 TD | 

| 6| TABLE ACCESS BY INDEX RONID | T2 | 

/* 通 过 上 面 的 方法 ， 保 证 了 进行 连接 之 后 ， 结 果 集 的 最 终 顺序 。 而 且 Oracle 的 优化 器 也 足够 聪明 的 ， 认 识 到 了 目前 得 到 的 结果 就 是 根据 NAME 排 序 好 的 ， 因 此 忽略 了 SORT ORDER BY 的 操作 
束 


14.3 ”排序 过 程 及 内 存 使 用 


下 面 我 们 来 看 看 排序 的 基本 过 程 及 排序 过 程 中 内 存 的 使 用 情况 ， 毕 竟 排 序 操作 是 一 个 非常 消耗 内 存 的 动作 。 


1. 排 序 过 程 
先 来 看 看 排序 的 过 程 。 


1) 首先 评估 排序 的 数据 量 ， 如 果 排序 数据 量 较 大 ， 则 需要 将 排序 的 数据 分 为 小 块 。 


2 


针对 每 一 个 小 块 的 数据 进行 单独 排序 。 


3) 完成 小 块 数据 排序 后 ， 将 排 好 序 的 数据 写 入 用 户 临 时 表 空 间 的 临时 段 中 。 临 时 段 保存 中 间 数 据 ， 然 后 数据 库 继续 处 理 另 一 块 数据 。 


4 


i 


循环 上 述 过 程 ， 将 所 有 数据 排序 之 后 ， 数 据 库 将 提取 各 块 数据 的 一 部 分 继续 排序 ， 并 对 最 终 排序 进行 输出 。 


5) 如 果 排 序 区 太 小 ， 无 法 同时 合并 所 有 排序 块 ， 则 分 几 个 阶段 合并 部 分 排序 数据 ， 产 生 最 终 排序 并 进行 输出 。 


2 排序 中 的 内 存 使 用 


在 排序 操作 中 使 用 的 内 存 被 称 为 排序 区 。 一 般 在 专 有 服务 器 模式 下 ， 排 序 区 是 用 户 全 局 区 (UGA) 的 一 部 分 ， 都 在 专 有 服务 器 进程 PGA 的 内 存 使 用 范畴 中 。 但 要 是 使 用 共享 服务 器 模式 ， 则 排序 区 会 占 


共享 池内 的 内 存 。 这 种 方式 下 ， 如 果 对 大 数据 进行 排序 ， 则 会 对 共享 池内 存 使 用 造成 冲击 。 现 在 大 多 数 情况 下 ， 生 产 环境 还 是 使 用 专用 服务 器 模式 。 下 面 针对 专 有 服务 器 模式 下 ， 内 存 的 使 用 进行 说 明 。 


在 专 有 服务 器 模式 下 ， 建 议 配置 PGA_AGGREGATE_TARGET 和 WORKAREA_SIZE_POLICY， 以 便 自动 管理 PGA 内 存 。 将 WORKAREA_SIZE_POLICY 设 置 为 AUTO， 设 置 工作 区 长 度 自 动 调整 。 而 


PGA_AGGREGATE TARGET 则 是 指定 所 有 专用 服务 器 进程 可 以 使 用 的 目标 累计 PGA 内 存 。 当 我 们 进行 常规 的 串 行 操作 时 ， 为 串 行 操作 分 配 的 任何 一 个 工作 区 最 大 被 限制 为 pga_aggregate_target 的 5%; 对 
并 行 操作 工作 区 分 配 的 限制 是 : 操作 中 涉及 的 所 有 并 行 子 进程 所 用 的 内 存 总 量 不 超过 pga_aggregate target 的 30% (同时 每 个 子 进 程 使 用 的 上 限 是 5%， 这 意味 着 若 执行 一 个 平行 度 超过 6 的 查询 ， 则 只 能 看 
到 30% 的 上 限 效果 了 ) 。 可 以 通过 一 系列 隐 含 参数 调整 对 内 存 的 使 用 ， 这 些 参数 主要 有 : 


是 


* _smm_max_size; 串 行 执行 分 配 内 存 的 上 限 。 
“ _smm_px_max_size: 并 行 执行 分 配 内 存 的 上 限 。 
“ _smm_min_size: 一 个 会 话 所 能 获得 的 工作 区 的 最 小 有 效 内 存 。 


在 通常 情况 下 ， 排 序 操作 都 是 在 内 存 中 完成 的 。 如 果 排 序数 据 量 很 大 ， 在 内 存 里 不 能 完成 排序 的 话 ， 则 会 拆 分 成 多 个 部 分 。 针 对 每 一 部 分 ， 单 独 进行 排序 ， 排 好 序 的 数据 会 临时 存放 在 磁盘 上 。 这 也 
“磁盘 排序 ”概念 的 由 来 。 根 据 数据 规模 的 不 同 ， 排 序 可 能 会 采取 三 种 不 同 的 策略 最 优 排序 、 一 遍 排序 、 多 凯 排序 ， 这 部 分 内 容 在 12.4 节 已 介绍 过 ， 这 里 不 再 重复 。 


3 .磁盘 排序 与 内 存 排序 


我 们 上 面 所 介绍 的 最 优 排序 、 一 遍 排序 、 多 饥 排 序 在 应 用 时 会 涉及 一 个 很 重要 的 概念 一 一 磁盘 排序 。 当 需要 排序 的 数据 量 很 大 ， 在 内 存 里 不 能 完成 时 ，Oracle 会 分 阶段 来 排序 ， 每 次 先 排 一 部 分 ， 并 且 


把 排 好 序 的 数据 临时 存放 在 用 户 默认 临时 表 空 间 中 的 临时 段 上 。 临 时 表 空间 对 应 的 临时 文件 属于 磁盘 文件 ， 这 也 是 磁盘 排序 的 由 来 。 相 较 于 内 存 排序 来 说 ， 磁 盘 排序 的 效率 要 低 很 多 。 下 面 我 们 具体 对 比 一 
下 三 种 排序 情况 。 


(1) 最 优 排序 


排序 中 最 理想 的 情况 就 是 最 优 排序 ， 也 就 是 需要 排序 的 数据 都 放 在 内 存 里 ， 而 且 内 存 有 足够 空间 做 排序 。 排 序 本 身 的 原理 可 能 是 相当 复杂 的 ， 但 是 大 致 的 说 法 应 该 是 排序 时 在 内 存 中 需要 维护 一 个 树 形 


的 结构 来 完成 排序 ， 所 以 假如 你 有 5MB 的 数据 需要 排序 ， 这 时 候 你 需要 的 内 存 会 远大 于 5MB。 


可 以 在 10033 事 件 中 看 到 产生 的 排序 归并 段 。 排 序 时 转 储 到 磁盘 的 数据 格式 意味 着 转 储 的 总 数据 量 可 能 比 预 期 的 大 很 多 。 如 果 没 有 排序 归并 段 ， 说 明 都 在 内 存 中 完成 了 排序 动作 。 内 存 排序 是 采用 二 分 


什么 转 储 后 的 数据 量 要 大 于 原始 的 数据 量 ， 当 然 /O 缓 冲 还 要 占用 内 存 。 当 执行 完全 存储 器 内 部 排序 时 ， 需 要 遍历 的 树 非常 高 ( 树 的 高 度 是 Log2 ( 行 数 ) ) ， 但 当 转 储 一 部 分 数据 后 ， 存 储 器 内 部 每 个 排序 
归并 段 对 应 的 树 都 很 低 ， 因 此 消耗 在 CPU 的 时 间 会 减少 。 如 果 系统 的 瓶颈 是 CPU， 并 且 I/O 子 系统 的 负载 不 大 ， 可 以 考虑 从 内 部 排序 转 为 一 遍 排 序 的 最 小 内 存量 ， 这 样 有 可 能 提高 效率 。 通 常设 置 


sort_area_size 为 不 至 于 产生 多 遍 操作 的 最 小 值 (在 workarea_size_policy 为 自动 时 ， 已 经 体现 了 这 个 策略 ) 。 


(2) 一 遍 排序 


一 遍 排序 的 过 程 会 复杂 一 些 。 假 如 需要 排序 的 是 1~20， 但 内 存 一 次 只 能 排序 5 个 数据 ， 这 时 候 不 得 不 5 个 数据 做 一 个 排序 。 每 排 好 一 组 就 放 在 临时 文件 上 ， 最 后 在 磁盘 上 就 存在 4 组 数据 。 注 意 这 4 组 数 
据 都 是 有 序 的 结果 。 这 时 候 ， 如 果 内 存 足够 一 次 容纳 下 排序 组 个 数 的 数据 ， 那 么 此 时 就 是 进行 的 一 遍 排序 。 针 对 这 个 例子 ， 也 就 是 说 内 存 可 以 一 次 容纳 下 4 个 数据 。 后 面 的 操作 方式 就 是 从 各 组 中 找到 最 小 的 
(假设 是 升序 排序 ) ， 然 后 找到 的 那 组 再 补充 1 个 新 的 元 素 (类 似 堆 栈 弹出 一 个 元 素 ， 后 续 元 素 补 上 ) 。 后 面 的 工作 就 是 重复 上 面 的 操作 ， 再 从 4 个 元 素 中 找到 最 小 的 。 以 此 类 推 ， 直 到 全 部 元 素 遍历 完毕 。 


(3) 多 遍 排序 


多 遍 排 序 的 过 程 更 复杂 ， 它 是 指 内 存 很 小 ， 连 排序 组 个 数 的 数据 都 无 法 容纳 。 就 上 面 的 例子 而 言 ， 内 存 小 到 无 法 容纳 4 个 数据 。 此 时 ， 就 无 法 进行 一 遍 排 序 ， 而 要 进行 多 遍 排序 。 假 设 此 时 的 内 存 能 容纳 
3 个 数据 ， 如 果 需 要 对 20 个 数据 进行 排序 ， 则 需要 在 临时 文件 中 对 数据 进行 分 组 ， 控 制 每 组 3 个 元 素 ， 总 共 7 组 。 每 组 3 个 元 素 ， 排 序 后 保存 到 临时 文件 中 。 然 后 对 每 3 组 按照 上 面 一 遍 排 序 的 方式 进行 处 理 ， 


次 ) ， 因 此 这 种 方式 称 为 多 遍 排序 。 这 里 的 遍 数 越 多 ， 自 然 排序 的 时 间 也 就 越 长 。 


14.4 ”执行 计划 中 的 “Sort” 


其 结果 保存 到 另 一 个 临时 文件 中 (这 个 文件 最 终 会 有 3x3 个 元 素 ) 。 重 复 上 面 的 过 程 ， 然 后 对 新 生成 的 一 组 临时 数据 再 进行 排序 ， 以 得 到 最 终结 果 。 因 为 在 临时 表 空 间 中 需要 多 次 排序 、 保 存 (上 面 例子 是 2 


在 执行 计划 中 ， 我 们 经 常 能 看 到 “Sort” 字 样 ， 给 人 的 直观 影响 就 是 排序 。 其 实 ， 在 Oracle 中 ，Sort 远 非 简单 的 排序 。 下 面 ， 我 们 看 看 和 Sort 相 关 的 执行 计划 。 


1.Sort Aggregate 


Sort Aggregate 不 一 定 涉及 排序 ， 当 聚合 用 来 计算 所 有 行 值 时 ， 会 用 到 Sort Aggregates。 它 通常 发 生 在 使 


Sort， 并 不 会 用 到 排序 空间 ， 而 是 通过 一 个 全 局 变量 + 全 表 /全 索引 扫描 来 实现 。 


一 些 聚 合 函 数 的 时 候 ， 如 sum、avg、max、count 等 。 实 际 上 sort Aggregate 不 做 真正 的 


SQL> select count (*) from t objects; 


| Id | Operation | Name | Rows | Cost $CPU) | Time | 

| 0 | SELECT STATEMENT | | | 344 (1) 1 090+ 00* 05 1 
| 1 | SORT AGGREGATE | I | | | 

| 2 1 TABLE ACCESS FULL| T OBJECTS | 86297 | 344 (1) | 00: 00: 05 | 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time 

| 0 | SELECT STATEMENT | | | | 344 (1) | 00: 00: 05 | 
| 1 | SORT AGGREGATE | ] | :| | 

| 2 1 TABLE ACCESS FULL| T OBJECTS | 86297 | 421K| 344 (1) 0D07 DO 05 1 


// 在 使 用 聚合 函数 中 ， 执 行 计划 都 用 到 了 Sort Aggregate 


2.Sort Unique 


Sort Unique， 顾 名 思 义 即 排序 去 重 。 往 往 发 生 在 用 户 指定 distinct 语 法 或 者 下 一 步 操作 需 


唯一 值 时 ， 会 导致 Sort Unique。 


SQL> select distinct object id from t objects; 


ee Operation | Name | Rows | 
0 SELECT STATEMENT | | 86297 | 
二 HASH UNIQUE 1 | 86297 | 
2 TABLE ACCESS FULL| T OBJECTS | 86297 | 


0 | SELECT STATEMENT | | 86297 | 
1 SORT UNIQUE | | 86297 | 
2 TABLE ACCESS FULL| T OBJECTS | 86297 | 


// 果 然 ， 在 执行 计划 中 出 现 了 预期 的 Sort Unique。 


/* 在 语句 中 指定 了 DISTINCT， 但 执行 计划 中 并 没有 Sort Unique。 这 主要 是 因为 从 10g R2 开 始 ，Sort Unique 有 了 一 些 变化 。Sort Unique 变 成 了 Hash Unique， 利 用 新 的 哈 希 算法 代替 了 传统 的 Sort Unique。 下 面 我 们 禁用 
x 
/ 


SQL> select /*+opt param ('_gby hash aggregation enabled', 'false') */ distinct object id from t objects; 


下 面 看 看 另外 一 种 情况 ， 就 是 下 一 步 操作 是 唯一 值 的 情况 。 


SQL> select owner from t objects where object id in (select object id from t_objects) ; 


Id Operation | Name | Rows | 
0 SELECT STATEMENT | | 86297 | 
* 二 HASH JOIN RIGHT SEMI| | 86297 | 
2 TABLE ACCESS FULL | T OBJECTS | 86297 | 
二 TABLE ACCESS FULL | T OBJECTS | 86297 | 
/* 外 部 查询 的 过 滤 条 件 OBJECT_ ID 需要 内 部 查询 的 返回 唯一 值 列 表 进 行 过 滤 。 在 默认 情况 下 ， 优 化 器 将 其 转换 为 哈 希 半 连 接 来 处 理 。 下 面 禁用 看 看 
Sf 
SQL> select /*+opt param ('hash join enabled', 'false') */ owner from t objects where object id in (select object id from t objects) ; 
Id Operation | Name | Rows | 


0 SELECT STATEMENT | | 86297 | 
1 MERGE JOIN SEMI | | 86297 | 
虽 SORT JOIN | | 85297 | 
| TABLE ACCESS FULL| T_OBJECTS | 86297 | 
* 4 SORT UNIQUE | | 86297 | 
5 TABLE ACCESS FULL| T_ OBJECTS | 86297 | 


// 禁 用 哈 希 连接 后 ， 两 者 转换 为 MREGE JOIN。 在 对 内 层 循环 的 处 理 中 ， 使 用 了 Sort Unique 


3.Sort Join 


假如 行 按照 连接 键 排序 ， 在 排序 合并 连接 时 将 会 发 生 Sort Join。Sort Join 发 生 在 出 现 Merge Join 的 情况 下 ， 两 张 关联 的 表 要 各 自 做 Sort， 然 后 再 Merge。 在 上 一 个 例子 中 ， 就 是 这 种 情况 。 


4.Sort Group By 


当 聚 合用 来 计算 不 同 组 的 数据 时 ， 将 会 使 用 Sort Group By， 排 序 需要 将 把 行 值 分 成 不 同 的 组 。 这 个 操作 经 常 发 生 在 Group By 的 时 候 。 在 10g R2 以 后 ，Sort Group By 被 Hash Group By 所 代替 。 


SQL> select owner, count (*) from t objects group by owner; 


Id Operation Name Rows 
0 SELECT STATEMENT 24 
下 HASH GROUP BY 24 
2 TABLE ACCESS FULL| T_OBJPCTS 86297 


// 测 试 环境 是 11g R2， 默 认 采 用 的 是 Hash Group By。 禁用 看 看 
SQL> select /*+topt param ('_gby hash aggregation enabled'， 'false') */ owner, count (*) from t objects group by owner; 


SELECT STATEMENT 24 
SORT GROUP BY 24 
TABLE ACCESS FULL| T_ OBJECTS 86297 


// 果 然 使 用 了 Sort Group By 


5.Sort Order By 


这 是 最 常见 的 一 种 情况 ， 按 照 一 个 非 索引 列 进行 排序 就 会 发 生 这 种 情况 。 


SQL> select * from t objects order by status; 


| 0 | SELECT STATEMENT | | 86297 | 
| 1 | SORT ORDER BY | | 86297 | 
| 2 1 TABLE ACCESS FULL| T OBJECTS | 86297 | 


6.Buffer Sort 


Buffer Sort 一 般 是 指 在 内 存 中 进行 的 排序 动作 。 有 时 Oracle 会 借助 会 话 私 有 的 内 存 区 域 (PGA) 完成 动作 ， 但 这 个 提示 并 不 表明 一 定 发 生 排序 。 至 于 为 什么 称 为 Buffer Sort， 可 能 是 因为 排序 操作 经 常 
发 生 在 PGA 中 。 


SQL> select tl.user id, t2.username from t users tl1, t users t2; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT | | 961 | 13454 | 38 (0) | 00: 00: 01 | 
| 1 | MERGE JOIN CARTESIAN| | 961 | 13454 | 38 (0) | 00: 00: 01 | 
| | TABLE ACCESS FULL | T USERS | | 124 | 3 (0) | 00: 00: 01 | 
| 3 1 BUFFER SORT 人 | 31 1 310 | 35 (0) | 00: 00: 01 | 
| 4 1 TABLE ACCESS FULL | T USERS | | 0 | 1 (0) | 00: 00: 01 | 


/* 这 两 个 表 没 有 连接 条 件 ， 因 此 走 的 是 笛 卡 儿 积 。 在 执行 计划 中 出 现 的 Buffer Sort， 表 示 Oracle 使 用 PGA 区 将 扫描 T_USRES 的 结果 缓存 起 来 。 这 种 方式 的 好 处 是 比 存在 SGA 中 节省 了 很 多 开销 (例如 检 锁 ) 


第 15 章 子 查询 


子 查 询 是 指 在 一 个 SELECT 语 句 中 赃 套 另 一 个 SELECT 语 句 。 子 查询 与 主 查 询 之 间 并 不 是 水 平 关系 ， 而 是 从 属 关系 。 这 就 意味 着 不 论 使 用 哪 种 类 型 的 子 查 询 ， 都 必须 确保 不 能 改变 主 查 询 的 完整 性 。 通 常 
情况 下 ， 优 化 器 都 会 将 子 查询 合并 到 主 查 询 中 ， 以 便 产 生 更 优质 的 执行 计划 。 这 里 可 能 采用 嵌 套 循环 、 排 序 合并 或 哈 希 连接 等 方式 。 


下 面 我 们 来 看 看 子 查询 可 能 的 几 种 处 理 方式 。 


15.1 处 理 方式 


在 合并 之 后 ， 可 能 有 两 种 处 理 方式 : 一 种 是 子 查询 优先 ， 一 种 是 主 查询 优先 。 


1. 子 查询 优先 


如 果子 查询 与 主 查询 的 表 连 接 方 式 是 优先 执行 子 查询 ， 并 将 其 执行 结果 提供 给 主 查询 的 谋 套 循环 连接 ， 那 么 优化 器 将 优先 执行 子 查 询 ， 并 通过 对 结果 进行 唯一 排序 SOR (UNIQUE) ， 再 与 主 查询 进行 
连接 。 在 排序 合并 连接 和 哈 希 连接 中 ， 也 是 这 样 处 理 的。 通常 可 以 看 到 类 似 下 面 的 执行 计划 。 


NESTED LOOPS 
VIEW 
SORT (UNIQUE) 
TABLE ACCESS http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 
INDEX (RANGE SCAN) OF http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/... 
TABLE ACCESShttp://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 
INDEX (FULL SCAN) http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 


2. 主 查询 优先 


如 果 将 主 查 询 的 执行 结果 作为 外 侧 循环 来 使 用 ， 而 把 子 查询 作为 内 侧 循环 来 使 用 。 此 时 采用 在 内 侧 循环 中 第 一 行 被 连接 成 功 之 后 就 立刻 结束 内 侧 循环 的 方式 。 这 种 处 理 方式 所 制定 的 策略 就 是 前 面 在 谋 
套 循环 中 提 到 的 FILTER。 通 常 可 以 看 到 类 似 下 面 的 执行 计划 。 


FILTER 
TABLE ACCESS http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 
INDEX (FULL SCAN) http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 
TABLE ACCESS http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/O0EBPS/Text/... 
INDEX (RANGE SCAN) http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/... 


下 边 我 们 首先 来 看 看 子 查询 的 分 类 。 


15.2， 子 查询 分 类 
子 查询 的 分 类 方法 有 很 多 ， 通 常 可 以 有 如 下 分 类 。 


15.2.1 按照 语法 分 类 


按照 语法 分 类 ， 子 查询 有 以 下 几 种 : 


“ 相关 子 查询 : 常用 于 exists、not exists 中 ， 当 然 inp、not in 也 可 以 。 它 的 语法 特点 是 相互 包含 ， 外 表 的 信息 被 子 查询 引用 ， 子 查询 谨 套 在 外 部 查询 中 。 语 法 意义 上 的 含义 是 存在 性 判断 ， 比 如 下 面 的 示 
例 。 


select * from emp a where exists (select 1 from dept b where a.deptno=b.deptno) ; 


: 非 相 关子 查询 : 常用 于 in、notin 中 ， 语 法 特点 是 子 查询 与 外 部 查询 完全 可 以 独立 运行 。 语 法 意义 上 的 含义 是 主 表 谓 词 对 应 的 范围 筛选 ， 比 如 下 面 的 示例 。 


select * from emp a where a.deptno in ( select b.deptno from dept b) ; 


“ 标量 子 查询 : 常用 于 结果 集 不 大 ， 子 查询 访问 非常 高 效 的 情况 。 希 望 针 对 每 个 外 部 查询 的 结果 ， 查 询 其 他 表 、 视 图 等 信息 。 语 法 的 特点 是 每 行 匹配 结果 都 是 单行 单列 。 一 般 使 用 相关 标量 子 查询 居 
多 。 语 法 意义 上 如 果 匹 配 不 到 ， 则 为 室 。 优 化 这 种 查询 多 改 为 Duter Join， 注 意 连 接 条 件 是 否 为 室 ， 比 如 下 面 的 示例 。 


select a.ename, a.deptno, (select b.dname from dept b where a.deptno=b.deptno) deptname from emp a; 


15.2.2 ”按照 谓词 分 类 


按照 谓词 分 类 ， 子 查询 有 以 下 几 种 。 


“ 单行 子 查询 : 子 查 询 返 回 的 数据 只 有 一 行 ， 比 如 下 面 的 示例 。 


select a.ename, a.deptno, a.sal from emp a where a.deptno=10 and a.sql= (select max (b.sal) from emp b where a.deptno=b.deptno) ; 


“ 多 行 子 查询 : 子 查询 返回 数据 为 多 行 ， 比 如 下 面 的 示例 。 


select * from emp a where a.deptno in (select b.deptno from dept b) ; 


“ 单列 子 查询 : 只 返回 一 列 数据 ， 比 如 下 面 的 示例 。 


select ename from emp where sal> (select avg (sal) from emp) ; 


“ 多 列子 查询 : 可 返回 多 列 数据 。 比 如 下 面 的 示例 。 


select a.ename, a.deptno, a.sal from emp a where (a.deptno , a.sal) in (select b.deptno, max (b.sal) from emp b) ; 


15.2.3 示例 
下 面 我 们 看 几 个 示例 ， 特 别 是 一 些 关于 特殊 称谓 子 查询 的 示例 。 
1. 标 量子 查询 


一 个 返回 单 值 的 子 查询 ， 就 是 标量 子 查询 ， 下 面 看 一 个 示例 。 


SQL> select count (*) from emp where sal< (select avg (sal) from emp) ; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT | | Ea 了 3- | 6 (0) | 00: 00: 01 | 
| 1 | SORT AGGREGATE | | 二 | 了 3: | | 
[| TABLE ACCESS FULL | EMP | 1 | 13 | 3 人) 1 D0 OE OL 1 
| 半 . | SORT AGGREGATE | | 工 | 13 | | 上 | 

| 4 | TABLE ACCESS FULL| EMP | 14 | 182 | 3 (0) | 00: 00: 01 | 


示例 中 的 子 查询 部 分 ， 返 回 的 是 员工 的 平均 工资 ， 只 是 一 个 单 值 ， 因 此 这 是 一 个 标量 子 查询 。 从 执行 情况 上 来 看 ， 整 个 语句 执行 了 两 遍 对 EMP 表 的 扫描 。 一 饥 是 标量 子 查询 返回 平均 工资 ， 一 遍 是 以 这 
个 工资 为 过 滤 条 件 过 滤 全 表 。 


标量 子 查询 除了 可 以 出 现在 WHERE 部 分 外 ， 也 可 以 出 现在 SELECT 部 分 ， 下 面 看 另外 一 个 示例 。 


SQL> select empno, ename, deptno, (select dname from dept where dept.deptno=emp.deptno) dname from emp; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT | | 14 | 462 | 和 (oy | O00 Om 0 | 
I* 1 | TABLE ACCESS FULL| DEPT | | 22 1 3 CO 0s 00: 0 | 
| 2 | TABLE ACCESS FULL| EMP | 14 | 462 | 滞 (oy | .00 O00: | 


// 这 是 一 个 对 EMP 表 的 全 表 查 询 ， 其 中 对 于 DEPTNO 字 段 利 用 一 个 标量 子 查询 ， 查 询 出 部 门 名 称 


2. 内 联 视图 


出 现在 FROM 子 句 中 的 子 查询 ， 被 称 为 内 联 视图 (Inline View) ， 我 们 看 一 个 示例 


SQL> select * from (select * from emp order by sal) where rownum<4; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time 


| 0 | SELECT STATEMENT | | | 261 | 4 (25) DO OQ OL | 
I* 1 | COUNT STOPKEY | lL | | | | 

| a7 | VIEW | | 14 | 1218 | € 《25) 1 OQ: .002 OE | 
| SORT ORDER BY STOPKEY| I 14 | 1218 | 4 (25) | 00: 00: 01 | 
| 4 1 TABLE ACCESS FULL | EMP | 14 | 1218 | 3 (0) | 00: 00: 01 | 


// 示 例 中 FROM 部 分 就 是 一 个 子 查询 ， 数 据 库 会 把 它 作 为 一 个 视图 来 看 待 。 


3. 谋 套子 查询 


出 现在 WHERE 子 句 中 的 子 查 询 称 为 谋 套 子 查询 (Nested Subquery) 。 在 谋 套 子 查询 中 ， 根 据 与 主 查询 的 关系 ， 子 查询 又 可 以 分 为 关联 子 查询 和 非 关联 查询 。 如 果 风 套 子 查询 是 主 查询 WHERE 条 件 的 
逻辑 表达 式 的 一 部 分 ( 非 IN、EXISTS 子 查询 ) ， 并 且 谍 套子 查询 的 查询 条 件 中 还 包含 主 查询 中 表 的 字段 ， 那 么 这 样 的 子 查询 称 为 互 关联 子 查询 。 下 面 我 们 看 看 关联 子 查询 和 非 关联 子 查询 的 示例 。 


1) 关联 子 查询 的 示例 如 下 。 


SQL> select el.ename, el.sal from emp el where el.sal= (select min (sal) from emp e2 where el.deptno=e2.deptno) ; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT 1 | 3.1 117 1| 7 “15) | OQ OQ0: OL |] 
I* 1 | HASH JOIN | 1 | 117 | 3 “15) | OQ OO OL |] 
| 二 | VIEW I sol 1 31 78 | 4 (25) { VG: 00: -01 ] 
| 3 | HASH GROUP BY | 3 | 21 | 4 (25) | 00: 00: 01 | 
| 4 | TABLE ACCESS FULL| EMP 1 14 1| 98 | 3 (0h 1 00: 09002101 1 
| 5 ,| TABLE ACCESS FULL | EMP 1 14 1| 182 | 3 《0 41 00; 00: OL 1 


2) 非 关 联 子 查询 的 示例 如 下 。 


SQL> select el.ename, el.sal from emp el where el.sal= (select min (sal) from emp e2) 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT | 1 | 10 1 6 (0) | 00: 00: 01 | 
I* 1 | TABLE ACCESS FULL | EMP | 吉川 30 1 3 (0) | 00: 00: 01 | 
| 闻 |] SORT AGGREGRATE | | | | | | 

| 31 TABLE ACCESS FULL| EMP | 14 1| 56 1 3 (0) | 00: 00: 01 | 


子 查询 的 执行 情况 很 复杂 ， 针 对 子 查 询 的 执行 ， 优 化 器 内 置 了 多 种 优化 手段 。 下 面 来 重点 看 看 这 些 优化 手段 。 


15.3” 子 查询 优化 


针对 子 查 询 ， 优 化 器 支持 了 多 种 优化 策略 。Oracle 查 询 转换 功能 主要 有 启发 式 (基于 规则 ) 查询 转换 以 及 基于 Cost 的 查询 转换 两 种 ， 针 对 子 查询 主要 有 Subquery Unnest、Push Subquery 等 。 查 询 转 
换 的 目的 是 转化 为 Join (包括 Semi、Anti Join 等 ) ， 充 分 利用 索引 、Join 技 术 等 高 效 访问 方式 提高 效率 。 如 果子 查询 不 能 unnest (启发 式 ) ， 可 以 选择 把 子 查询 转换 为 Inline View (基于 Cost) ;如果 都 
不 可 以 ， 那 么 子 查 询 就 会 最 后 执行 ， 可 能 会 看 到 类 似 Filter 的 操作 。 


1. 子 查询 转换 


下 面 先 通过 一 个 示例 看 看 。 


SQL> create table t objects as select * from dba objects; 
Table created. 

SQL> create table t users as select * from dba users; 

Table created. 

SQL> create index idx users created on t users (created) ; 
Index created. 上 

SQL> create index idx objects created on t objects (created) ; 
Index created. 


SQL> exec dbms_stats.gather table stats ('hf', 't users', estimate percent => 15, cascade=>true) ; 
PL/SQL procedure successfully completed. 
SQL> exec dbms_stats.gather table stats ('hf', 't objects', estimate percent => 15, cascade=>true) ; 


PL/SQL procedure successfully completed. 
// 上 面 代码 准备 了 必要 的 数据 环境 ， 并 收集 相关 对 象 的 统计 信息 
SQL> select * from t objects a where a.created in (select b.created from t users b) ; 


0 SELECT STATEMENT 
NESTED LOOPS 

2 NESTED LOOPS 

3 SORT UNIQUE 

4 INDEX FULL SCAN IDX USERS CREATED 

5 INDEX RANGE SCAN IDX OBJECTS CREATED 
6 TABLE ACCESS BY INDEX ROWID T_OBJECTS 

// 默 认 情 况 下 ， 是 将 上 面 的 操作 转换 为 表 间 关 联 方 式 执行 

SQL> select * from t objects a where a.created in (select /*+ no unnest push subq */ b.created from t users b) ; 


0 | SELECT STATEMENT | | 
守 主 TABLE ACCESS FULL| T OBJECTS | 
2 INDEX RANGE SCAN| IDX USERS CREATED | 


1 - filter ( EXISTS (SELECT /*+ PUSH SUBQ NO UNNEST */ 0 FROM "T USERS" "B" 
WHERE "B"."CREATED"=: B1) 了 加 ga 
2 - access ("B"."CREATED"=: B1) 
nat 禁止 了 子 查 询 解 谋 套 。 一 次 采用 了 原始 的 方式 执行 ， 子 查询 部 分 的 作用 就 是 "FILTER" 
x 


2. 子 查询 合并 


子 查询 合并 是 指 优化 器 不 再 单独 为 子 查询 生成 执行 计划 ， 而 是 将 子 查询 合并 到 主 查询 中 ， 最 终 为 合并 后 的 结果 生成 一 个 最 优 的 执行 计划 。 可 以 通过 参数 simple view_merging 或 者 提示 
MERGE/NO_MERGE 来 控制 是 否 开启 、 关 闭 子 查询 合并 。 


根据 子 查询 的 复杂 程度 ， 子 查询 可 分 为 简单 子 查 询 、 复 杂 子 查询 。 所 谓 简 单子 查询 ， 是 指 可 以 简单 将 子 查询 字段 投影 到 外 部 的 情况 。 对 于 这 种 情况 ， 优 化 器 采取 的 是 启发 式 策略 ， 即 满足 条 件 下 就 行 合 
并 。 而 复杂 子 查询 是 指 存在 分 组 行 数 的 情况 。 针 对 这 种 情况 ， 优 化 器 采取 的 是 基于 代价 的 策略 ， 最 终 是 否 转换 取决 于 成 本 。 当 然 还 有 一 些 子 查询 是 无 法 进行 合并 的 。 下面 通 过 几 个 示例 看 一 下 。 


SQL> select * from (select e.ename, (Select d.dname from dept d where d.deptno=e.deptno) dname from emp e) 7 where v.dname='xxx'; 


Id Operation Name Rows Bytes Cost (%CPU) Time | 


0 | SELECT STATEMENT 14 224 3 (0) | 
类 二 TABLE ACCESS FULL | DEPT 1 13 3 (0) | 
wi VIEW 14 224 3 (0) | 
3 TABLE ACCESS FULL 3 | 


(select d.dname from dept d where d.deptno=e.deptno) dname from emp e) V where v.dname='xxx'; 


0 | SELECT STATEMENT 

1 TABLE ACCESS FULL 
党“ 洲 FILTER 

3 TABLE ACCESS FULL 

4 TABLE ACCESS FULL 


3. 解 说 套子 查询 


解 谋 套 子 查询 是 指 在 对 存在 谋 套 子 查询 的 复杂 语句 进行 优化 时 ， 查 询 转 换 器 会 尝试 将 子 查 询 展开 ， 使 得 其 中 的 表 能 与 主 查询 中 的 表 关 联 ， 从 而 获得 更 优 的 执行 计划 。 部 分 子 查询 反 谋 套 属于 启发 式 查 询 
转换 ， 部 分 属于 基于 代价 的 转换 。 


系统 中 存在 一 个 参数 来 控制 解说 套子 查询 一 一 unnest_subquery。 参 数 unnest_subquery 在 8i 中 的 默认 设置 是 false， 从 9i 开 始 其 默认 设置 是 true。 然 而 9i 在 非 满 套 时 不 考虑 成 本 。 只 有 在 10g 中 才 开 始 
考虑 两 种 不 同 选择 的 成 本 ， 并 选取 成 本 较 低 的 方式 。 当 从 8i 升 级 到 9i 时 ， 可 能 想 阻塞 某 些 查询 的 非 嵌 套 。 利 用 子 查询 中 的 no_unnest 提 示 可 以 完成 这 一 点 。 在 8i 和 9i 中 ， 如 果 
star transformation_enabled=true， 则 非 嵌 套 时 被 禁用 (即使 用 了 提示 ) 。 在 11g 环 境 下 还 受 优化 器 参数 optimizer_unnest_all subqueries 控 制 。 此 外 ， 提 示 UNNEST/NO_UNNEST 可 以 控制 是 否 进行 
解说 套 。 


下 面 我 们 通过 几 个 示例 看 看 解 吝 套子 查询 。 


1) IN/EXISTS 转 换 为 SEMI JOIN : 


SQL> select * from emp where exists (select 1 from dept where dept.deptno=emp.deptno) ; 


| Operation | Name | Rows 


0 SELECT STATEMENT | | 
1 HASH JOIN SEMI | | 
TABLE ACCESS FULL| EMP | 
3 TABLE ACCESS FULL| DEPT | 
/* 示 例 中 的 子 查询 引用 表 DEPT， 最 终 转换 为 两 个 表 的 哈 希 半 连 接 。 也 就 是 说 ，exists 子 句 中 的 子 查询 被 展开 ， 其 中 的 对 象 与 主 查询 中 的 对 象 直接 进行 半 关 联 操作 
# 
//_IN 的 情况 类 似 ， 如 下 : 

SQL> select * from emp where deptno in (select deptno from dept) ; 


必 Operation | Name | Rows | Bytes | Cost (%CPU) | 
| 0 SELECT STATEMENT | | 14 | 574 | 6 (0) | 
有 浅 -二 HASH JOIN SEMI | | 14 | 574 | 6 (0) | 
| 2 TABLE ACCESS FULL| EMP | 14 | 532 | 3 (0) | 
| 3 TABLE ACCESS FULL| DEPT | 4 1 开 | 3 (0) | 


2) IN/EXISTS 转 换 为 ANTI JOIN: 


SQL> select * from emp where not exists (select 1 from dept where dept.deptno= emp.deptno) ; 


| Id | Operation | Name | Rows Bytes | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT | | 5 205 | 6 (0) | | 

I* 1 | HASH JOIN ANTI | 5 205 | 6 (0) | | 

| -| TABLE ACCESS FULL| EMP | 14 S32 | 3 (0) | | 

| 3 | TABLE ACCESS FULL| DEPT | 4 | 3 (0) | | 

/* 优 化 器 将 NOT EXISTS 后 的 子 查询 做 解 嵌 套 ， 然 后 选择 了 哈 希 的 反 连 接 。 这 种 转换 属于 基于 代价 的 查询 转换 。 


Sy 
// 下 面 看 看 NOT IN 的 情况 
SQL> select * from emp where emp.deptno not in (select deptno from dept) ; 


| Id | Operation | Name | Rows Bytes | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT | | 5 2 | 6 (0) | 00: | 

I* 1 | HASH JOIN ANTI NA | | 3 205: | 6 (0) | 00: | 

| 2 1 TABLE ACCESS FULL| EMP | 14 532 | 3 (0) | 00: | 

| 3 1 TABLE ACCESS FULL| DEPT | 4 12 | 3 (0) | 00: | 

/* 和 NOT EXISTS 类 似 ， 也 选择 了 哈 项 连接 ， 只 不 过 是 HASH JOIN RNTI NA。 这 里 的 NA， 实 际 表示 Nu11-Aware 的 意思 ， 在 119 及 以 后 的 版 本 中 ，Oracle 增 加 了 对 空 值 敏感 的 反 关联 的 支持 


A 


3) 关联 子 查询 的 解 谋 套 : 在 对 于 关联 子 查 询 的 解 谋 套 过 程 中 ， 会 将 子 查 询 构 造 出 一 个 内 联 视图 ， 并 将 内 联 视图 与 主 查询 的 表 进 行 关联 。 这 个 操作 可 以 通过 参数 _unnest_subquery 来 控制 。 这 种 转换 属 
于 启发 式 查询 转换 。 


SQL> select * from emp el where el.sal> (select max (sal) from emp e2 where el.empno =e2.empno) ; 


| Id | Operation | Name 

| 0 | SELECT STATEMENT | | 
I* 1 | HASH JOIN | | 
| 21 VIEW | va_sQ 1 | 
| 3 1 HASH GROUP BY | 
| 4 1 TABLE ACCESS FULL| EMP | 
| 5 | TABLE ACCESS FULL | EMP | 


/* 在 ID=2 的 步骤 中 生成 了 内 联 视图 ， 然 后 跟 外 部 表 进 行 的 哈 希 连接 。 下 面 修改 参数 ， 看 优化 器 如 何 处 理 

a 

SQL> alter session set " unnest subquery"=false; 

Session altered. 

SQL> select * from emp el where el.sal> (select max (sal) from emp e2 where el.empno=e2.empno) ; 


| Id | Operation | Name | Rows | Bytes | Cost 

| 0 | SELECT STATEMENT | | a || 38 1 24 
I* 1 | FILTER | | | | 

| 艺 |] TABLE ACCESS FULL | EMP | 14 | 532 | 

| 3. 1] SORT AGGREGATE | 1 | 8 | 

I* 4 1 TABLE ACCESS FULL| EMP | | 8 | 


// 这 里 转换 成 了 谋 套 循环 的 一 种 特 列 FILTER 


4. 子 查询 推进 


子 查询 推进 是 一 项 对 未 能 合并 或 者 反 赃 套 的 子 查 询 优化 的 补充 优化 技术 。 这 一 技术 是 在 9.2 版 本 引入 的 。 通 常情 况 下 ， 未 能 合并 或 者 反 谋 套 的 子 查询 的 子 计划 会 被 放置 在 整个 查询 计划 的 最 后 执行 ， 而 子 
查询 推进 使 得 子 查询 能 够 提前 被 评估 ， 使 之 可 以 出 现在 整体 执行 计划 较 早 的 步骤 中 ， 从 而 获得 更 优 的 执行 计划 。 可 以 通过 PUSH_SUBQ/NO_PUSH_SUBQ 来 控制 。 


SQL> select * from emp where sal= (select max (sal) from emp) ; 


1 Operation Name | Rows | Bytes | Cost (%CPU) Time | 
0 SELECT STATEMENT | | 38 1 6 (0) 00: 00: 01 | 
* 1 TABLE ACCESS FULL EMP | 11 38 1 及 (0) 00: 00: 01 | 
世 SORT AGGREGRATE | 加 省 41 | | 
3 TABLE ACCESS FULL| EMP | 14 1| 56 |] 3 (0) 00: 00: 01 | 


/ /默认 情况 下 ， 就 是 用 子 查询 推进 技术 。 对 比 一 下 ， 我 们 看 看 强制 不 使 用 的 情况 
SQL> select /*+ no push subq (eqb1) */ * from emp where sal= (select /*+ qo name (qbl1) */ max (sal) from emp) ; 


0 | SELECT STATEMENT 
二 FILTER 

2 TABLE ACCESS FULL 
3 SORT AGGREGATE 
4 CESS 


es 对 了 一 步 FILTER。 这 里 使 用 了 谋 套 循环 


5. 子 查询 分 解 


所 谓 子 查询 分 解 ， 是 指 由 WITH 创 建 的 复杂 查询 语句 存储 在 临时 表 中 ， 按 照 与 一 般 表 相同 的 方式 使 用 该 临时 表 的 功能 。 从 概念 上 来 看 它 与 说 套 视图 比较 类 似 ， 但 各 自 有 其 优 缺 点 。 优 点 在 于 子 查询 如 果 被 
多 次 引用 ,使 用 说 套 视图 就 需要 被 执行 多 次 ， 尤 其 在 海量 数据 中 满足 条 件 的 结果 非常 少 得 情况 下 ， 两 者 差别 很 明显 。 使 用 WITH 子 查询 的 优点 就 在 于 其 复杂 查询 语句 只 需要 执行 一 次 ， 但 结果 可 以 在 同一 个 查 
询 语句 中 被 多 次 使 用 。 缺 点 是 使 用 WITH 子 查询 ， 由 于 不 允许 执行 查询 语句 变形 ， 所 以 无 效 的 情况 也 比较 多 。 尤 其 是 WITH 中 的 查询 语句 所 创建 的 临时 表 无 法 拥有 索引 ， 当 其 查询 结果 的 数据 量 比较 大 的 时 
候 ， 很 可 能 会 影响 执行 效率 。 


[ 


下 面 通过 一 个 是 示例 看 看 。 


SQL> with 
间 dept costs as 
号 (select dname，sum (sal) dept total from emp e, dept d where e.deptno=d.deptno group by dname) ， 
4 avg cost as 
号 【select sum (dept total) /count (*) avg sal from dept costs) 
6 select * 本 加 加 
7 from dept costs 
8 where dept total> (select avg sal from avg cost) 
9 order by dname; 
Id Operation | Name 
0 SELECT STATEMENT 1 
二 TEMP TABLE TRANSFORMRATION | 
4 LOAD AS SELECT | SYS_TEMP OFD9D6622 33CE6D 
3 HASH GROUP BY | 
* 4 HASH JOIN 1 
3 TABLE ACCESS FULL | DEPT 
6 TABLE ACCESS FULL | EMP 
7 SORT ORDER BY | 
先生 VIEW 1 
9 TABLE ACCESS FULL | SYS_TEMP OFD9D6622 33CE6D 
10 VIEW | 
LE SORT AGGREGATE 1 
12 VIEW | 
13 TABLE ACCESS FULL | SYS_TEMP OFD9D6622 33CE6D 


人 在 WITH 中 有 两 个 子 查询 语句 ， 但 只 创建 了 一 个 临时 表 ， 这 是 因为 WITH 中 的 第 二 个 子 查询 使 用 的 是 第 一 个 子 查询 的 执行 结果 。 在 这 种 情况 下 ， 膛 辑 上 只 允许 创建 一 个 临时 表 ， 没 有 必要 再 次 创建 。 在 处 理 RITH 临 8 


6 . 子 查询 缓存 


针对 某 些 子 查询 操作 ， 优 化 器 可 以 将 子 查询 的 结果 进行 缓存 ， 避 免 重复 读 取 。 这 一 特性 在 FILTER 型 的 子 查询 或 标量 子 查询 中 都 能 观察 到 。 看 一 个 示例 。 


SQL> select /* hf demol */ /*+ gather Plan statistics */ * from scott.emp a where a.deptno in (select /*+ no_unnest */ b.deptno from dept b) ; 


| Id | Operation | Name | Starts | A-Rows | 
| 0 | SELECT STATEMENT | 1 |] 14 | 
|* 1 | FILTER | | | 14 1 
| -| TABLE ACCESS FULL| EMP | 二 省 14 1| 
全 等 | INDEX UNIQUE SCAN| PK DEPT | 号 | 31 


/* 注 意 Id=3 步 骤 的 Start=3 (emp 表 中 的 deptno 有 3 个 不 同 的 值 ， 这 里 就 重复 执行 3 次 ) 。 这 体现 了 Cache 技 术 ， 标 量子 查询 中 也 有 类 似 的 Cache 技 术 。 
专 / 


15.4， 子 查询 特殊 问题 
子 查询 还 有 一 此 特殊 的 问题 ， 在 日 常 优化 中 值得 关注 。 


15.4.1 空 值 问题 


首先 值得 关注 的 问题 是 ， 在 NOT IN 子 查询 中 ， 如 果子 查询 列 有 空 值 存在 ， 则 整个 查询 都 不 会 有 结果 。 这 可 能 是 跟 主观 逻辑 上 感觉 不 同 ， 但 数据 库 就 是 这 样 处 理 的 。 
点 。 看 个 例子 吧 。 


加 


此 ， 在 开发 过 程 中 ， 需 要 注意 这 一 


SQL> select * from dual where 2 not in (select 1 from dual) ; 

D 

区 

SQL> select * from dual where 2 not in (select 1 from dual union all select null from dual) ; 
no rows selected 


// 显 然 ， 第 二 条 语句 在 印象 中 应 该 会 返回 记录 ， 但 实际 情况 就 是 没有 。 


第 二 个 值得 关注 的 是 ， 在 11g 之 前 ， 如 果 主 表 和 子 表 的 对 应 列 未 同时 有 NOT NULL 约 束 ， 或 都 未 加 IS NOT NULL 限 制 ， 则 Oracle 会 走 FILTER。11g 有 新 的 ANTI NA (NULL AWARE) 优化 ， 可 以 正常 对 
子 查询 进行 UNNEST。 笔 者 在 以 前 的 实际 工作 中 ， 就 处 理 过 类 似 的 优化 案例 。 


SQL> create table anti testl as select * from dba objects; 
Table created. 


SQL> create table anti test2 as select * from dba objects; 
Table created. 
SQL> select /*+ optimizer features enable ('10.2.0.5') */ * from anti test1 a where a.object id not in (select b.object id from anti test2 b) ; 


0 SELECT STATEMENT | | 
和 FILTER 1 | 
2 TABLE ACCESS FULL| ANTI TEST]1 | 
可. 总 TABLE ACCESS FULL| ANTI TEST2 | 


比 时 的 关联 字段 0BJECT_ID， 是 可 为 空 的 。 示 例 模拟 了 11g 以 前 的 情况 ， 此 时 走 了 最 原始 的 FILTER 
SOL> select /*+ optimizer features enable ('10.2.0.5') */ * from anti testl] a where a.object id is not null and a.object id not in (select b.object id from anti test2 b where 


0 | SELECT STATEMENT | | 
1 HASH JOIN RIGHT ANTI| | 
费 莹 TABLE ACCESS FULL | ANTI TEST2 | 
3 TABLE ACCESS FULL | ANTI TEST1 | 


/* 在 确定 子 查询 列 object_id 不 会 有 NULL 存 在 的 情况 下 ， 又 不 想 通过 增加 NOT NULIL 约 束 来 优化 ， 可 以 通过 上 面 方式 进行 改写 


select * from anti testl a where a.object id not in (select b.object id from anti test2 b) ; 


TT Operation | Name | 
0 SELECT STATEMENT | | 
和 > 下 HASH JOIN RIGHT ANTI NA| | 
4 TABLE ACCESS FULL | ANTI_TEST2 | 
3 TABLE ACCESS FULL | ANTI_TEST1 | 


// 在 11g 的 默认 情况 下 ， 走 的 就 是 ANTI NA (NA=NULL RNRARE) 


15.4.2 ”OR 问题 


对 含有 OR 的 Anti Join 或 Semi Join， 注 意 有 FILTER 的 情况 。 如 果 FILTER 影 响 效率 ， 可 以 通过 改写 为 UNION、UNION ALL、AND 等 逻辑 条 件 进行 优化 。 优 化 的 关键 要 看 FILTER 满 足 条 件 的 次 数 。 看 下 
面 的 示例 。 


SQL> select count (*) from emp a a where exists (select 1 from emp b b where a.ename=b.ename or a.deptno=b.deptno) ; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 

| 0 | SELECT STATEMENT | [ 下 20 | 12 (Oh 1 -00s DO OL 1 
| 1 | SORT AGGREGATE | [ 工 | 20 1 | | 

[ a FILTER | | | | | | 

| 3 | TABLE ACCESS FULL| EMP A | 14 | 280 | 号 Oy | "00 Dos 0 1 
[| TABLE ACCESS FULL| EMP B | | 20 1 3 (0) | 00: 00: 01 | 


69 consistent gets 

// 上 例 中 包含 有 OR 条 件 的 Semi Join， 执 行 计划 中 使 用 了 FILTER 过 滤 ， 整 个 地 辑 读 消 耗 为 69 
// 下 面 通过 改写 ， 看 看 效果 如 何 ? 
SQL> select count (*) 

2 from 

3 
4 select a.rowid from emp a a where exists (select 1 from emp b b where a.ename=b.ename) 
8 union 
6 select a.rowid from emp a a where exists (select 1 from emp b b where a.deptno=b.deptno) 
7 


Id | Operation | Name | Rows | Bytes | Cost $CPU) | Time | 
0 | SELECT STATEMENT | | | 1 14 15) (OO0r QO OE | 
1 | SORT AGGREGATE | | a | 1 | | 
2 | VIEW | | 28:1 | 4. 15) | VO 00: VL ] 
3 1 SORT UNIQUE | | 28 | 896 | 14 (15) | 00: 00: 01 | 
| UNION-ALL 1 1 1 1 | | 

| HASH JOIN SEMI 1 | 14 | 364 | 6 《0) | O00 00 OF. 
6 | TABLE ACCESS FULL| EMP A | 14 | 266 | 3 (0) | 00: 00: 01 | 
7 1 TABLE ACCESS FULL| EMP B 1 14 1| 98 | 3 (0) | 00: 00: 01 | 

| HASH JOIN SEMI 1 | 14 1| 532 | 6 (0) | 00: 00: 01 | 
:| TABLE ACCESS FULL| EMP A | 14 1| 350 | 3 (0) | 00: 00: 01 1 
10 | TABLE ACCESS FULL| EMP B | 14 | 182 | 3 CO D0 00 VL 1 


30 consistent gets 


// 将 上 面 的 OR 连接 修改 为 UNION， 消 除了 FILTER。 从 成 本 或 逻辑 读 等 角度 来 看 ， 整 个 逻辑 读 为 30， 较 前 面 的 69 大 大 降低 了 


15.4.3”[NOTJIN/EXISTS 问 题 


下 面 看 两 个 关于 [NOT]JIN/EXISTS 的 问题 。 


1.IN/EXISTS 


从 原理 来 讲 ，IN 操 作 是 先进 行 子 查 询 操 作 ， 再 进行 主 查询 操作 。EXISTS 操 作 是 先进 行 主 查 询 操 作 ， 再 到 子 查 询 中 进行 过 滤 。 


IN 操 作 相当 于 对 inner table 执 行 一 个 带 有 distinct 的 子 查询 语句 ， 然 后 得 到 的 查询 结果 集 再 与 outer table 进 行 连接 ， 当 然 连 接 的 方式 和 索引 的 使 用 仍然 等 同 于 普通 的 两 表 连 接 。EXISTS 操 作 相当 于 对 
outer table 进 行 全 表 扫 描 ， 用 从 中 检索 到 的 每 一 行 与 inner table 做 循环 匹配 输出 相应 的 符合 条 件 的 结果 ， 其 主要 开销 是 对 outer table 的 全 表 扫 描 (full scan) ， 而 连接 方式 是 nested loop 方 式 。 


当 子 查询 表 数 据 量 巨大 上 且 索引 情况 不 好 (大 量 重复 值 等 ) ， 则 不 宜 使 用 产生 对 子 查询 的 distinct 检 索 而 导致 系统 开支 巨大 的 IN 操作 ; 反之 当 外 部 表 数 据 量 巨大 (不 受 索 引 影 响 ) 而 子 查询 表 数 据 较 少 且 索 
引 良 好 时 ， 不 宜 使 用 引起 外 部 表 全 表 扫 描 的 EXISTS 操 作 。 如 果 限 制 性 强 的 条 件 在 子 查询 ， 一 般 建议 使 用 IN 操作 。 如 果 限 制 性 强 的 条 件 在 主 查询 ， 则 使 用 EXISTS 操 作 。 


2.NOT IN/EXISTS 


在 子 查询 中 ，NOT IN 子 句 将 执行 一 个 内 部 的 排序 和 合并 。 无 论 在 哪 种 情况 下 ，NOT IN 都 是 最 低 效 的 (因为 它 对 子 查询 中 的 表 执行 了 一 个 全 表 人 遍历) 。 为 了 避免 使 用 NOT IN， 可 以 把 它 改写 成 外 连接 
(Outer Joins) 或 NOT EXISTS。 


第 16 章 并 行 


并 行 是 Oracle 支 持 的 一 种 处 理 方式 ， 目 的 就 是 将 一 条 语句 分 布 到 多 个 CPU 上 执行 。 特 别 是 OLAP 基 于 大 数量 的 分 析 系 统 时 ， 往 往 可 以 采用 这 种 方式 加 速 处 理 过 程 。 其 基本 原理 很 简单 ， 就 是 将 一 个 大 的 
数据 块 分 割 成 多 个 小 的 数据 块 ， 然 后 启动 多 个 进程 分 别处 理 多 个 数据 块 ， 最 后 由 一 个 进程 整合 结果 返回 给 用 户 。 当 然 ， 并 行 不 是 在 任何 情况 下 都 会 使 用 。 一 般 我 们 建议 ， 只 有 当 系 统 有 大 量 闲置 资源 ， 且 
SQL 通过 串 行 方式 执行 时 间 过 长 时 ， 才 考虑 使 用 并 行 处 理 ， 但 同时 要 考虑 闲置 并 行使 用 的 数量 。 


下 面 看 看 哪些 操作 可 以 使 用 并 行 处 理 。 


16.1 并行 操 作 
在 并 行 技术 中 ， 可 以 在 多 类 操作 中 引入 并 行 。 常 见 的 有 以 下 几 种 : 
“ 并 行 查询 : 使 用 多 个 操作 系统 进程 来 执行 一 个 查询 。 优 化 器 在 发 现 具 备 并 行 执行 查询 的 条 件 下 ， 会 创建 一 种 新 型 的 执行 计划 来 处 理 语句 。 后 面 我 们 会 看 到 具体 事例 。 
“并行 DML: 并 行 处 理 INSERT、DELETE、UPDATE 和 MERGE 操 作 。 如 果 DML 中 包括 查询 (类 似 insert into table select) 类 操作 ， 也 可 以 并 行 处 理 。 
“并行 DDL: 并 行 执行 DDL 类 的 操作 ， 比 较 典 型 的 有 索引 重建 、 数 据 加 载 、 大 表 重 组 等 。 
“其他: 除 上 述 几 种 外 ， 还 可 以 在 很 多 领域 使 用 并 行 技术 ， 例 如 数据 加 载 、 统 计 信 息 收集 、 事 务 回 滚 、 数 据 库 恢复 、 数 据 导 入 导出 等 


下 面 我 们 来 看 看 最 为 常见 的 并 行 查询 、 并 行 DML 和 并 行 DDL.。 


16.1.1 ”并行 查询 


并 行 查询 是 指针 对 查询 语句 使 用 并 行 处 理 。 当 目标 语句 发 生 全 表 扫 描 、 全 分 区 扫描 及 索引 快速 全 扫描 的 情况 时 ， 优 化 器 如 果 满足 一 些 前 提 条 件 下 是 可 以 选择 使 用 并 行 处 理 的 。 前 提 条 件 有 : 


1) 会 话 并 行 查询 特性 : 可 以 在 会 话 一 级 启用 或 禁用 并 行 查询 ， 默 认 情 况 下 是 启用 的 。 启 用 、 禁 用 命令 分 别 如 下 : 


alter session enable parallel query; // 启 用 
alter session disable parallel query; // 禁 用 


此 外 ， 还 可 以 通过 下 面 查询 来 查看 当前 会 话 是 否 启用 了 并 行 查询 。 


select pq status 
from v$session 
where sid=sys_context ('userenv', 'sid') ; 


举 


ol 


这 个 属性 可 返回 enabled、disabled、forced， 分别 对 应 


和 强制 。 其 中 ， 强 制 是 一 种 特殊 的 状态 ， 它 会 强制 查询 语句 指定 并 行 度 查询 ， 甚 至 会 覆盖 后 面 讲 到 的 对 象 并 行 属性 。 设 置 方法 如 


alter session force parallel query parallel ni 


2) SQL 语句 并 行 提示 : 并 行 提示 可 以 覆盖 上 面 会 话 级 别 的 设置 。 一 方面 ， 即 使 在 会 话 级 别 禁 用 了 并 行 查询 ， 提 示 也 可 以 强制 执行 一 个 并 行 操作 。 唯 一 可 以 用 来 关闭 并 行 查询 的 方法 是 将 
parallel_ max_servers 设 置 为 0。 另 一 方面 ， 即 使 在 会 话 级 别 强制 设置 了 一 个 并 行 度 ， 提 示 还 是 可 以 改变 另外 一 个 并 行 度 。 并 行 提示 是 使 用 /*+ parallel*/ 来 指定 的 。 


3) 对 象 设置 并 行 属性 : 在 SQL 语句 相关 的 对 象 中 可 设置 并 行 属 性 ， 也 可 使 用 并 行 查询 。 这 是 在 对 象 定义 时 指定 的 ， 也 可 以 后 期 修改 。 


下 面 通过 几 个 示例 ， 看 看 如 何 通过 提示 、 对 象 属性 及 强制 会 话 来 完成 并 行 查询 。 下 面 首先 看 看 使 用 提示 的 方式 。 


SQL> create table t as select * from dba objects; 
Table created. 
SQL> select /*+ parallel (t 2) */ count (*) from t; 


| 0 | SELECT STATEMENT 1 | 1 

| 1 1 SORT AGGREGATE 1 | 1 

| 2 1 PX COORDINATOR | 1 

EE “- 委 二 PX SEND QC (RANDOM) | : TQ10000 | Q1, 00 | P->S | QC (RAND) | 
| | | 

| 51 | | 

| 61 | | 


SORT AGGREGATE Q1, 00 | PCWP | 
EX BLOCK ITERATOR | Q1, 00 | PCWC | 
TABLE ACCESS FULL| T Q1, 00 | PCWP | 


// 这 个 示例 使 用 提示 方式 ， 启用 并 行 查询 执行 了 这 个 语句 


下 面 解释 一 下 执行 步 又 : 
“ ID 二 6: 扫描 表 的 一 部 分 ， 上 有 具体 扫描 哪个 部 分 取决 于 它 的 父 操作 (好 PX BLOCK ITERATOR) 。 
“ID=5: 将 全 表 扫 描 分 解 为 较 小 的 扫描 ， 这 是 一 个 涉及 块 范围 粒度 的 操作 。 


:ID=4: 每 个 扫描 汇总 其 count (status) 的 值 。 


“ID 二 2、3: 将 每 个 子 结果 传递 给 查询 调度 进程 。 从 这 个 执行 计划 中 ， 可 以 通过 TQ 字段 识别 出 哪些 操作 是 由 一 组 从 属 进 程 来 执行 的 。 在 这 个 计划 中 ， 操 作 3、4、5、6 拥 有 同样 的 值 (Q1，00) ， 因 此 


它们 是 由 同一 组 从 属 进 程 执 行 的 (从 执行 计划 中 无 法 得 知 从 属 进 程 的 数量 ) 。 此 外 需要 注意 ， 操 作 3 中 的 从 属 进 程 与 查询 调度 进程 (QC) 之 间 的 由 并 行 到 串 行 (P->S) 的 通信 过 程 非常 必要 。 


“ ID 二 1， 进 一 步 汇总 这 些 结果 ， 并 输出 答案 。 


下 面 看 看 使 用 对 象 属性 的 方式 。 


SQL> alter table t parallel 2; 
Table altered. 
SQL> select count (*) from t; 


| 0 | SELECT STATEMENT | | | 
| 1 | SORT AGGREGATE | | | 
| 总 |] PX COORDINATOR | | 
| :| PX SEND QC (RANDOM) | : TQ10000 | Q1, 00 | P->S | QC (RAND) | 
[| 村 | | | 
| 51 | | 
1 | | 


SORT AGGREGATE Q1, 00 | PCWP | 
EX BLOCK ITERATOR | Q1, 00 | PCWC | 
TABLE ACCESS FULL| T Q1, 00 | PCWP | 


// 设 置 对 象 属性 后 ， 使 用 了 并 行 查询 方式 


下 面 看 看 使 用 强制 会 话 的 方式 。 


SQL> alter table t noparallel; 


Table altered. 


SQL> select count (*) from 七 ; 


| 0 | SELECT STATEMENT | 
| 1 | SORT AGGREGATE 1 
| | TABLE ACCESS FULL| 


Name | Rows | Cost (%CPU) | Time | 
| 下 344 (1) | 00: 00: 05 1 
| 1 | 1 | 

T | 80000 | 344 (1) | 00: 00: 05 | 


// 此 时 没有 使 用 并 行 


SQL> alter session force parallel query parallel 2; 


Session altered. 


SQL> select count (*) from t; 


| Id | Operation | Name TQ |IN-OUT| PQ Distrib | 

| 0 | SELECT STATEMENT 1 | | 1 

| 1 1 SORT AGGREGATE 1 1 | 1 

| 2 | PX COORDINATOR 1 | 1 

| 31 PX SEND QC (RANDOM) | : TQ10000 | Q1, 00 | P->S | QC (RAND) | 
| 41 SORT AGGREGATE Q1, 00 | PCWP | | 

上 “二 PX BLOCK ITERATOR | Q1, 00 | ECWC | | 

| -$5.1 TABLE ACCESS FULL| T Q1, 00 | ECWP | | 

// 这 里 通过 强制 设置 会 话 并 行 属性 ， 使 用 了 并 行 查询 

还 要 注意 一 点 ， 会 话 默认 是 启动 并 行 查询 的 ， 可 以 将 会 话 关闭 。 


SQL> alter table t parallel 
Table altered. 
SQL> select count (*) from 七 ; 


闪 


| 0 | SELECT STATEMENT 1 | | | 1 

| 1 1 SORT AGGREGATE | | | | 1 

| 2 | PX COORDINATOR 1 | | | 
1 PX SEND QC (RANDOM) | : TO10000 | Q1, 00 | P->S | QC (RAND) | 
上 和 1 SORT AGGREGATE 1 | Q1, 00 | PCWP | | 

| 5 |] PX BLOCK ITERATOR | | Q1, 00 | Pcwc | | 

| 61 TABLE ACCESS FULL| T | Q1, 00 | PCWwP | | 


// 默 认 情 况 下 ， 会 话 启用 并 行 查询 是 可 以 使 用 并 行 查询 的 
SQL> alter session disable parallel query; 
Session altered. 

SQL> select count (*) from t; 


0 | SELECT STATEMENT | 
| 1 | SORT AGGREGATE | 
这 | TABLE ACCESS FULL| 


// 关 闭 了 会 话 并 行 查询 ， 此 时 只 能 使 用 串 行 方式 了 


1 | 344 (1) | 00: 00: 05 | 
工 | 1 | 
时 0 1 


通过 上 面 的 示例 可 见 ， 并 行 查询 执行 计划 与 普通 的 串 行 操作 的 不 同 。 下 面 说明 在 并 行 操作 过 程 中 各 部 分 之 间 的 关系 。 在 并 行 执行 的 执行 计划 中 会 使 
出 中 ， 并 行 操作 之 间 的 关系 是 通过 字段 IN-OUT 来 提供 的 。 


: 并 行 到 串 行 (P->S) : 并 行 操作 发 送 数据 到 串 行 操作 。 通 常 是 并 行进 程 将 数据 发 给 并 行 调度 进程 。 


“并行 到 并 行 (P->P) : 一 个 并 行 操作 发 送 数 据 给 另 一 个 并 行 操作 。 当 存在 两 组 从 属 进 程 时 就 会 用 到 它 。 


* 并 行 与 父 操 作 合 并 (PCWP) 


* 并 行 与 子 操作 合并 (PCWC) 


: 执行 计划 中 的 相同 从 属 进程 并 行 执行 一 个 操作 及 其 父 操作 ( 父 操作 也 是 并 行 的 ) 。 因 此 ， 没 有 通信 发 生 。 


: 执行 计划 中 的 相同 从 属 进 程 并 行 执行 一 个 操作 及 其 子 操作 ( 子 操作 也 是 并 行 的) 。 因 此 ， 没 有 通信 发 生 。 


并 行 操作 之 间 的 下 列 关 系 。 在 dbms_xplan 产 生 的 输 


“ 串 行 到 并 行 (S->P) : 一 个 囊 行 操作 发 送 数据 给 并 行 操作 。 由 于 大 部 分 时 间 这 个 操作 的 效率 都 较 差 ， 因 此 应 该 避免 使 用 它 。 有 两 个 情况 会 产生 这 个 操作 。 一 个 是 单一 进程 产生 数据 的 速度 可 能 没有 多 
个 进程 消费 数据 的 速度 快 。 如 果 是 这 样 ， 消 费 者 可 能 花费 更 多 的 时 间 来 等 待 数据 而 不 是 真正 地 处 理 数据 。 另 一 个 是 ， 串 行 执行 的 操作 和 并 行 执行 的 操作 发 送 数据 需要 一 些 不 必要 的 通信 。 


16.1.2 ”并行 DML 


并 行 DML 是 指数 据 库 利 用 多 个 


肛 务 器 进程 来 执行 INSERT、DELETE、UPDATE、MERGE 等 操作 。 这 里 需要 注意 的 是 ， 每 个 并 行 执行 进程 有 自 


己 独 立 的 对 


务 。 


这 些 事务 都 结束 后 ， 


2PC 的 过 程 来 提交 这 些 单 独 的 独立 寻 


务 。 最 后 由 协调 会 话 提交 或 者 回 滚 。 


当 使 用 并 行 DML 时 存在 一 些 局 民 


民 性 ， 有 以 下 几 个 方面 : 


: 并行 DML 操 作 期 间 不 支持 触发 器 。 


:并行 DML 期 间 不 支持 以 某 些 声明 的 方式 引用 完整 性 约束 。 


“ 因为 表 中 的 每 一 个 部 分 会 在 单独 的 会 话 中 作为 单独 的 事务 进行 修改 。 


“ 在 提交 和 回 滚 之 前 ， 不 能 访问 用 并 行 DML 修改 的 表 。 


“并行 DML 不 支持 高 级 复制 (因为 高 级 复制 特性 的 实现 要 基于 触发 器 ) 。 


“ 不 支持 延迟 约束 (也 就 是 说 ， 


采用 延迟 模式 的 约束 ) 。 


例如 ， 并 行 DML 不 支持 自 引 用 完整 性 ， 如 果真 的 支持 了 ， 可 能 会 出 现 死 锁 或 其 他 锁定 问题 。 


会 执行 一 个 相当 于 


快速 


“ 如 果 表 是 分 区 的 ， 并 行 DML 只 可 能 在 有 位 图 索引 或 lob 列 的 表 上 执行 ， 而 且 并 行 度 取决 于 分 区 数 。 在 这 种 情况 下 ， 无 法 在 分 区 内 并 行 执 行 一 个 操作 ， 因 为 每 个 分 区 只 有 一 个 并 行 执行 服务 器 来 处 理 。 


“ 执行 并 行 DML 时 ， 不 支持 分 布 式 事务 。 


“并行 DML 不 支持 集群 表 (B* 树 群 或 散 列 群 ) 。 


“并行 DML 不 能 使 用 数据 库 连 接 (分 布 式 事务 ) 。 


除了 上 面 这 些 约束 外 ， 对 于 INSERT、MERGE 语 句 ， 并 行 操作 会 使 


并 行 DML 特 性 。 


直接 路 径 插入 。 这 势必 会 造成 一 些 空间 上 的 浪费 ， 这 一 点 需要 注意 。 此 外 ， 同 并 行 查询 类 似 ， 执 行 并 行 DML 也 有 前 提 条 件 一 一 会 话 


可 以 在 会 话 一 级 启用 或 禁用 并 行 DML， 可 使 用 如 下 命令 : 


alter session enable parallel dml; // 启 用 
alter session disable parallel dml; // 禁 用 


人 注意 只 有 执行 了 enable 这 个 操作 ，Oracle 才 会 对 之 后 符合 并 行 条 件 的 DML 操 作 并 行 执行 。 如 果 没 有 这 个 设 定 ， 即 使 SQL 中 指定 了 并 行 执行 ，Oracle 也 会 忽略 它 。 


可 以 通过 下 面 语句 查询 会 话 级 别 是 否 已 经 启用 了 并 行 DML。 


select pdml status 
from v$session 
where sid=sys_context ('userenv', 'sid') ; 


返回 的 状态 有 enable、disabled、forced， 其 中 forced 是 强制 设置 并 行 DML。 要 想 强 制 设置 使 用 并 行 DML， 可 使 用 如 下 命令 : 


alter session force Parallel dml parallel nj; 


在 使 用 并 行 DML 时 ， 还 有 一 些 需要 注意 的 地 方 : 


“ 默认 情况 下 ， 并 行 DML 是 被 禁止 的 (这 和 并 行 查询 刚好 相反 ) 。 


“ 与 并 行 查询 对 比 ， 单 独 使 用 提示 无 法 启动 并 行 DML 语 句 。 也 就 是 说 ， 必 须 在 会 话 级 别 绝对 启用 并 行 的 情况 下 ， 才 可 以 并 行 处 理 DML 语 身 。 


“ 9i 以 前 ， 并 行 DML 要 求 必须 分 区 。 如 果 表 没有 分 区 ， 是 不 能 并 行 执 行 操作 的 。9i 以 后 的 版 本 ， 这 个 限制 有 所 放松 。 只 有 两 个 例外 : 如 果 和 希望 在 一 个 表 执 行 并 行 DML， 而 且 这 个 表 的 一 个 lob 列 上 有 一 个 
位 图 索引 ， 要 并 行 执行 操作 就 必须 对 这 个 表 分 区 ; 另外 并 行 度 限制 了 分 区 数 。 不 过 总 体 来 说 ， 使 用 并 行 DML 并 不 一 定 要 求 进行 分 区 。 


“ 如 果 不 提 交 (或 回 滚 ) 事务 的 话 ， 执 行 并 行 DML 语 句 的 会 话 ( 只 是 当前 会 话 ， 对 其 他 会 话 来 讲 ， 来 提交 的 数据 甚至 是 不 可 见 的 ) 无 法 访问 被 修改 的 表 。 如 果 在 提交 (或 回 滚 ) 以 前 执行 这 样 的 SQL 语 


Ey 


系统 会 抛 出 异常 。 


下 面 看 一 个 并 行 DML 的 示例 。 


SQL> create table tl as Select * from dba objects where 1=0; 
SQL> create table t2 as select * from dba objects; 

// 构 建 数据 环境 

SQL> alter session disable parallel query; 

SQL> alter session disable Parallel dml; 

// 禁 用 了 并 行 查询 和 并 行 DML 

SQL> explain Plan for insert into tl select * from 七 2; 

SQL> select * from table (dbms xplan.display) ; 


| Id | Operation | Name | Rows | Bytes | Cost (%CPU) | Time | 
| 0 | INSERT STATEMENT | 1 B1577 | 10M| 156 02 | 
| 1 | TABLE ACCESS FULL| T2 1 B1577 1 10M| 156 02 | 


// 常 规 的 全 表 扫 描 ， 串 行 操作 

alter session disable parallel query; 
alter session enable parallel dml; 

// 启 用 并 行 DML， 禁 用 并 行 查询 


SQL> explain Plan for insert /*+ Parallel (tl1, 2) */ into tl select * from 七 2; 


SQL> select * from table (dbms xplan.display) ; 


| Id | Operation | Name | TO |IN-OUT| PQ Distrib | 

| 0 | INSERT STATEMENT 1 | | | | 

| 1 | PX COORDINATOR | | | | | 

| 2 | PX SEND QC (RANDOM) | : TQ10001 | Q1, 01 | P->S | QC (RAND) | 
| 3 | LOAD AS SELECT | | Ql1, 01 | PCWP | | 

| 41 BUFFER SORT | | aL OL. | Pew | | 

| 5 | PX RECEIVE | | Q1, 01 | ECWP | | 

| 6 | PX SEND ROUND-ROBIN| : TQ10000 | | S->P | RND-ROBIN | 

| 7 1 


TABLE ACCESS FULL 


A 

SQL> alter session enable parallel query; 
SQL> alter session disable parallel dml; 
// 禁 用 并 行 DML， 启 用 并 行 查询 


SQL> explain Plan for insert into tl select /*+ parallel (t2, 2) */ * from 七 2; 


SQL> select * from table (dbms xplan.display) ; 


| Id | Operation | Name | TQ |IN-OUT| PQ Distrib | 

| 0 | INSERT STATEMENT | | | | | 

| 1 | PX COORDINATOR | | | | | 

| 冯 ] PX SEND QC (RANDOM) | : TQ10000 | Q1, 00 | P->S | QC (RAND) | 
| 3 | PX BLOCK ITERATOR | | 00 1 .Pewe | | 

| 4 1 TABLE ACCESS FULL| T2 | Q1, 00 | PCWP | | 


/* 第 2、3、4 步 表示 一 个 并 行 查询 的 过 程 ， 统 一 交 给 “PX COORDINATOR” 后 ， 再 执行 串 行 的 INSERT (第 0 步 ) 


SQL> alter session enable parallel query; 
SQL> alter session enable parallel dml; 
// 启 用 并 行 DML， 启 用 并 行 查询 


SQL> explain Plan for insert /*+ Parallel (tl1, 2) */ into tl1 select /*+ parallel (t2, 2) */ * from 七 2; 


SQL> select * from table (doms xplan.display) ; 


/* 第 6 步 为 “S->P”， 这 表示 一 个 Serial to Parallel (就 是 一 个 串 行 向 并 行 发 送 数 据 的 过 程 ) 。 也 说 明了 T2 表 的 查询 是 串 行 执行 的 ， 而 T1 表 的 插入 是 并 行 的 


Id | Operation | Name | TQ |IN-OUT| PQ Distrib | 

0 | INSERT STATEMENT | 1 | | | 
1 | PX COORDINATOR | | | 1 | 
2 | PX SEND QC (RANDOM) | : TQ10001 | Q1, 01 | P->s | QC (RAND) | 
| LOAD AS SELECT | 号 | Q1, 01 | PCWP | | 
4 1 PX RECEIVE | | Q1, 01 | ECWP | | 
3,1 PX SEND ROUND-ROBIN| : TO10000 | Q1, 00 | P->P | RND-ROBIN | 
6 | PX BLOCK ITERATOR | | Q1, 00 | Pcwc | | 
ei TABLE ACCESS FULL| T2 | Q1, 00 | PCWP | | 

// 注 意 两 个 步骤 ，“P->P” 和 “P->S”。 

此 外 ， 由 这 个 语句 可 见 ， 除 了 INSERT 语 句 外 ， 并 行 执行 DML 语 句 也 需要 启用 并 行 查询 。 实 际 上 ，DML 语 句 是 有 两 部 分 组 成 的 ， 首 先 找到 


录 的 部 分 没有 并 行 执行 ， 那 么 修改 记录 的 部 分 就 不 能 被 并 行 执行 。 


16.1.3 并 行 DDL 


并 行 DDL 是 指数 据 库 针 对 某 些 DDL 操 作 采 取 并 行 处 理 方式 。 并 行 查询 可 以 
为 最 终 用 户 设计 的 ， 那 么 并 行 DDL 则 是 为 DBA 设 计 的 。 


要 被 修改 的 记录 ， 然 后 修改 这 些 记录 。 问 题 是 ， 如 果 查 找 记 


来 加 快 某 些 长 时 间 的 操作 ， 但 从 维护 角度 以 及 管理 


角度 来 看 ， 并 行 DDL 才 是 DBA 手 中 的 “利器 ”。 如 果 认 为 并 行 查询 主要 是 


可 采取 并 行 DDL 的 操作 很 多 ， 主 要 有 以 下 几 种 。 
1) 表 的 并 行 操作 。 


“ 执行 SELECT 的 查询 可 以 使 用 并 行 查询 来 执行 ， 表 加 载 本 身 也 可 以 并 行 完 成 ， 命 令 如 下 : 


CREATE TABLE http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 


AS SELECT (CTAS) 


. 表 移 动 ， 命 令 如 下 : 


ALTER TABLE http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/O0EBPS/Text/... 


MOVE 


2) 表 分 区 的 并 行 操作 。 


“ 表 分 区 移动 ， 命 令 如 下 : 


ALTER TABLE http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/... 


MOVE PARTITION 


“ 表 分 区 并 行 分 解 ， 命 令 如 下 : 


ALTER TABLE http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/... 


SPLIT PARTITION 


“ 表 分 区 并 行 合并 ， 命 令 如 下 : 


ALTER TABLE http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/O0EBPS/Text/... 


COALESCE PARTITION 


3) 索引 的 并 行 操作 。 


:多 个 并 行 执行 服务 器 可 以 扫描 表 、 对 数据 排序 ， 并 把 有 序 的 段 写 到 索引 结构 中 ， 命 令 如 下 : 


CREATE INDEX 


“ 索引 结构 可 以 并 行 重建 ， 命 令 如 下 : 


ALTER INDEX http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/... 


REBUILD 


4) 索引 分 区 的 并 行 操作 。 


“ 重建 索引 分 区 ， 命 令 如 下 : 


ALTER INDEX http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/... 


REBUILD PARTITION 


:索引 分 区 的 分 解 ， 命 令 如 下 : 


ALTER INDEX http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/O0EBPS/Text/... 


SPLIT PARTITION 


5) 创建 和 校 验 约束 ， 命 令 如 下 : 


ALTER TABLE http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/OEBPS/Text/... 


ADD CONSTRAINT http://www.hzcourse.com/resource/readBook 


同 并 行 DML 类 似 ， 也 可 以 在 会 话 级 别 设置 或 强制 并 行 DDL。 下 面 看 看 具体 用 法 。 


可 以 在 会 话 一 级 启用 或 禁用 并 行 DDL， 使 用 如 下 命令 : 


alter session enable Parallel ddl; 
alter session disable parallel ddl; 


注意 默认 情况 下 是 启用 并 行 DDL 的 。 可 以 通过 下 面 语句 查询 会 话 级 别 是 否 已 经 启用 了 并 行 DDL。 


select pddl status 
from v$session 
where sid=sys_context ('userenv', 'sid') ; 


返回 的 状态 有 enable、disabled、forced， 其 中 forced 是 强制 设置 并 行 DDL， 使 用 如 下 命令 : 


alter session force Parallel ddl parallel Di 


下 面 看 一 个 并 行 DDL 示 例 一 一 CTAS。 


SQL> alter session enable parallel dml; 
Session altered. 

SQL> alter session enable Parallel ddl; 
Session altered. 

SQL> explain Plan for create table tl parallel 2 as select /*+ Parallel (t 2) */ * from t; 
Explained. 

SQL> select * from table (dbms xplan.display) ; 


| Name | TQ |IN-OUT| PQ Distrib | 
| 0 | CREATE TABLE STATEMENT | | | | | 
| 1 1 PX COORDINATOR 1 | | | | 
| 21 EXSEND QC (RANDOM | :mol0000 | Q1, 00 | P->S | QC (RAND) | 
i LOAD AS SELECT 本 | Q1, 00 | PCWP | | 
| 41 EX BLOCK ITERATOR | | Q1, 00 | Pcwc | | 
| 导 '] TABLE ACCESS FULL | T | Q1, 00 | PCWP | | 


下 面 看 看 创建 索引 的 示例 。 


SQL> explain Plan for create index idx t id on t (object id) parallel 4; 
Explained. 
SQL> select * from table (dbms xplan.display) ; 


| Id | Operation | Name | TO |IN-OUT| PQ Distrib | 

| 0 | CREATE INDEX STATEMENT | | | | | 

| 1 | PX COORDINATOR | | 1 | | 

| 纪 |] PX SEND QC (ORDER) | : TQ10001 | Q1, 01 | P->S | QC (ORDER) | 
| 3. | INDEX BUILD NON UNIQUE| IDX T ID | Q1, 01 | PCWP | | 

| 4 1 SORT CREATE INDEX | i | Ql1, 01 | PCWP | | 

| :| PX RECEIVE | | Ql1, 01 | PCWP | | 

| -| PX SEND RANGE | : TQ10000 | Q1, 00 | P->P | RANGE | 

| | PX BLOCK ITERATOR | | Q1, 00 | PCWC | | 

| | TABLE ACCESS FULL| T | Ql1, 00 | PCWP | | 


上 面 我 们 谈 到 了 哪些 操作 可 以 用 到 并 行 ， 那 并 行 操作 可 以 在 哪些 级 别 上 使 用 呢 ? 我 们 在 前 面 简单 介绍 过 ， 下 面 统一 整理 。 


16.2 并 行 级 别 


一 般 可 以 在 如 下 几 种 级 别 可 使 用 并 行 操作 : 


“ 语句 级 : 这 种 情况 是 指 通过 指定 hint/*+parallel*/ ， 来 使 用 并 行 处 理 。 
: 会 话 级 : 这 种 情况 是 指 在 会 话 一 级 可 强制 会 话 中 执行 的 语句 使 用 并 行 处 理 。 通 过 alter session force parallel 来 设置 。 


“ 对 象 级 : 这 种 情况 是 指 对 于 对 象 ( 表 、 索 引 ) ， 通 过 定义 其 并 行 度 ， 使 得 与 这 些 对 象 相关 的 操作 可 使 用 并 行 处 理 。 


在 日 常 使 用 ， 一 般 我 们 不 建议 在 对 象 一 级 定义 其 并 行 度 ， 原 因 是 这 会 导致 相关 对 象 的 操作 都 变 为 并 行 处 理 ， 因 为 并 行 处 理会 占用 大 量 CPU 等 资源 ， 进 而 造成 整体 性 能 失控 。 会 话 一 级 也 不 建议 使 用 ， 
因为 这 会 对 开发 人 员 的 编程 能 力 要求 较 高 。 一 般 建议 在 满足 并 行 处 理 条 件 下 ， 在 语句 级 合理 指定 并 行 处 理 ， 相 对 而 言 这 是 “最 可 控 ” 的 一 种 方式 。 


上 面 我 们 了 解 了 Oracle 支 持 的 并 行 操作 及 并 行 操作 可 以 在 哪些 级 别 上 设置 ， 那 么 优化 器 在 处 理 并 行 操作 时 ， 是 如 何 进行 的 呢 》 下 面 我 们 看 看 它 的 实现 原理 。 


16.3 并行 原 理 


在 并 行 处 理 中 ， 最 重要 的 两 个 概念 是 对 从 属 进程 和 粒度 的 理解 。 下 面 分 别 说 明 一 下 


16.3.1 “从属 进程 


在 没有 并 行 处 理 的 时 候 ， 一 个 SQL 语句 只 能 由 单个 服务 器 进程 串 行 处 理 ， 也 就 是 只 能 运行 在 一 个 CPU 上 。 这 意味 着 执行 一 个 SQL 语句 能 够 使 用 的 资源 数量 会 受到 单个 CPU 能 够 处 理 的 资源 数量 的 限 
制 。 并 行 处 理 的 目标 是 将 一 个 大 的 任务 拆 分 成 多 个 小 一 点 的 子 任务 ， 此 时 会 同时 存在 多 个 从 属 进 程 在 协同 执行 一 个 SQL 语句 。 从 属 进程 之 间 的 协作 是 由 与 提交 SQL 语句 的 会 话 相关 联 的 服务 器 进程 控制 的 。 
这 个 服务 器 进程 被 称 为 查询 调度 进程 (query coordinator) 。 它 负责 创建 (取得 ) 从 属 进 程 、 给 这 些 从 属 进程 分 配子 任务 、 收 集合 并 从 属 进程 传递 过 来 的 不 完整 的 结果 集 ， 并 将 最 终 的 结果 集 返 回 给 客户 
端 。 如 果 语句 中 执行 了 多 个 操作 ， 例 如 扫描 和 排序 ， 则 数据 库 会 使 用 多 组 从 属 进 程 来 处 理 。 一 组 从 属 进 程 处 理 完毕 后 ， 传 递 给 另 一 组 从 属 进 程 进行 处 理 。 前 者 被 称 为 生产 者 ， 后 者 被 称 为 消费 者 。 这 两 者 之 
间 传 递 数据 的 方式 ， 可 以 选择 以 下 这 些 机 制 : 


“ 广播 : 每 个 生产 者 发 送 所 有 数据 到 每 一 个 消费 者 。 


“ 循环 复 用 : 生产 者 每 一 个 循环 给 一 个 消费 者 发 送 一 条 记录 。 结 果 ， 记 录 被 平均 分 配给 每 一 个 消费 者 。 

“ 范围 : 生产 者 将 指定 范围 的 记录 发 给 不 同 的 消费 者 。 会 应 用 动态 范围 分 区 来 决定 哪 条 记录 发 送 给 哪个 消费 者 。 

“ 哈 希 : 生产 者 根据 一 个 哈 希 函数 来 发 送 数据 给 消费 者 。 会 应 用 动态 哈 希 分 区 来 决定 哪 条 记录 发 送 给 哪个 消费 者 。 

“ QC 随机 : 每 个 生产 者 都 将 所 有 记录 发 送 给 查询 调度 进程 。 顺 序 是 不 重要 的 (随机 的 ) 。 这 是 与 查询 调度 进程 通信 时 最 常 使 用 的 分 配方 法 。 


“ QC 顺序 : 每 个 生产 者 都 将 所 有 记录 发 送 给 查询 调度 进程 。 顺 序 是 很 重要 的 。 例如， 并行 执行 的 排序 操作 用 它 来 给 查询 调度 进程 发 送 数 据 。 


数据 库 能 够 使 用 的 从 属 进程 是 有 限制 的 。 实 例会 维护 一 个 从 属 进程 池 ， 但 查询 调度 进程 从 这 个 池 中 请 求 从 属 进程 ， 
parallel_max_servers 之 间 的 。 对 于 当前 从 属 进程 池 的 使 用 情况 ， 可 以 通过 下 面 的 查询 获得 : 


党 


完毕 后 再 归还 给 从 属 进程 池 。 池 的 大 小 范围 是 介 于 parallel_min_servers 和 


select * from v$px process sysstat where statistic like 'Servers%®'; 


16.3.2 粒度 


在 进行 任务 拆 分 的 时 候 ， 拆 分 的 单位 为 一 个 “粒度 ”。 在 某 一 个 时 间 点 上 ， 每 个 从 属 进 程 只 会 处 理 一 个 粒度 。 至 于 粒度 的 选择 ， 可 以 以 分 区 为 单位 ， 也 可 以 以 块 范围 为 单位 。 但 选择 分 区 为 单位 时 ， 可 
能 存在 分 配 不 均衡 的 问题 ， 所 以 一 般 选 择 块 范 围 较 好 。 要 实现 有 效 的 并 行 化 ， 有 必要 在 所 有 的 从 属 进程 之 间 实 现 工作 量 的 均匀 分 配 。 并 行 操作 的 速度 是 由 其 中 运行 最 慢 的 那个 从 属 进程 来 决定 的 。 可 以 通过 
Vv$pq_tqstat 来 检查 一 个 SQL 语 句 的 真实 工作 量 分 配 。 这 个 视图 会 为 每 个 从 属 进程 以 及 执行 计划 中 的 每 个 PX SEND 和 PX RECEIVE 操 作 提供 一 条 记录 。 需 要 注意 的 是 ， 这 个 视图 仅仅 提供 当前 会 话 的 最 后 一 次 
并 行 执行 的 SQL 语句 的 信息 。dfo_number 就 是 对 应 执行 计划 TQ 字 段 中 字母 Q 后 面 的 数字 ，tq_id 对 应 逗号 后 面 的 数字 。 下 面 通过 一 个 示例 说 明 一 下 。 


SQL> create table 七 
2 partition by hash (id) Partitions 2 
3 Parallel 2 
4 as 
5 select rownum as id, rpad ('*', 100, '*') as pad 
6 from dual 
7 connect by level <= 160000; 
Table created. 


SQL> delete t where ora hash (id，1) 
60000 rows deleted. mi 

SQL> commit; 

Commit complete. 


SQL> execute dbms_ stats.gather table stats (ownname => user, 


PL/SQL procedure successfully completed. 
SQL> explain plan for 


= 0 and rownum <= 60000; 


tabname => 't') 


select /*+ leading (t1) pq distribute (t2 partition, none) */* 
Font 劾 - 光 1 二 沙 区 
where tl.id = t2.id; 
SQL> select * from table (doms xplan.display) ; 
Id Operation Name Pstart| Pstop | TQ |IN-OUT| 
0 SELECT STATEMENT | 1 | 1 
1 PX COORDINATOR | | | | 
2 PX SEND QC (RANDOM) | : TQ10001 | | | Ql 0 | B39: | 
%% 怠 HASH JOIN 1 1 QQ, 01 1 EPE 1 
4 PART JOIN FILTER CREATE : BF0000 | | { ol: OL 人 BCWE | 
PX RECEIVE | | Q1, 01 | PCWP | 
6 PX SEND PARTITION (KEY) 
: TQ10000 | | { QL 00 1 P->B | 
是 PX BLOCK ITERATOR 要 中 2 1 Ql1, 00 | PCWC | 
8 TABLE ACCESS FULL 了 工 | 2 1 Ql, 00 | PCWP | 
9 PX PARTITION HASH JOIN-FILTER 
: BF00001: BF0O000| Q1, 01 | PCWC | 
10 TABLE ACCESS FULL T : BF00001: BF0O000| Q1, 01 | PCWP | 
SQL> select dfo number, tq id, server type, process, num rows, bytes 
2 from vipq tqstat 
3 order by dfo number, tq id, server type desc, process; 
DFO_NUMBER TQ _ID SERVER TYPE PROCESS NUM _ ROWS BYTES 
昌 0 Producer P002 49631 5366477 
1 0 Producer P003 50369 5443591 
1 0 Consumer P000 20238 2188789 
1 0 Consumer P001 79762 8621279 
1 Producer P000 20238 4377530 
. 1 Producer P001 79762 17242534 
1 1 Consumer Qc 100000 21620064 
由 上 可 见 : 


“ ID=6 的 步骤 利用 两 个 从 属 进 程 P002、P003 分 别 发 送 了 49631、50369 条 记录 。 


:ID=5 的 步骤 接收 从 ID=6 发 送 过 来 的 数据 ， 其 中 利用 从 属 进程 P000 接 收 20238 条 记录 ， 利 用 从 属 进程 P001 接 收 79762 条 。 


A.1 样 例 数据 说 明 


这 里 对 本 书 中 常用 的 几 个 示例 表 进 行 说 明 。 


1.EMP 


附录 A ”常用 技巧 


EMPNO 为 主键 字段 ，DEPTNO 为 外 键 字段 ， 引 


自 DEPT 表 。 


这 说 明 此 例 中 基于 分 区 键 做 的 分 配 不 是 很 好 。 


SQL> desc emp; 


名 称 是 否 为 空 “” 类 型 

EMPNO NUMBER (4) 

ENAME VARCHAR2 (10) 

JOB VARCHAR2 (9) 

MGR NUMBER (4) 

HIREDATE DATE 
SAL NUMBER (7, 2) 

COMM NUMBER (7, 2) 

DEPTNO NUMBER (2) 

SQL> select * from emp; 

EMPNO ENRAMP JOB MGR HIREDATE SAL COMM DEPTNO 
7369 SMITH CLERK 7902 17-12 月 -80 800 20 
7499 ALLEN SALESMAN 7698 20-2 月 -81 1600 300 3 
7521 WARD SALESMAN 7698 22-2 月 -81 1250 500 30 
7566 JONES MANAGER 7839 02-4 月 -81 2975 20 
7654 MARTIN ”SALESMRAN 7698 28-9 月 -81 1250 1400 30 
7698 BLAKE MANAGER 7839 01-5 月 -81 2850 30 
7782 CLARK MANAGER 7839 09-6 月 -81 2450 10 
7839 KING PRESIDENT 17-11 有 -81 5000 10 
7844 TURNER SALESMAN 7698 08-9 月 -81 1500 0 30 
7900 JAMES CLERK 7698 03-12 月 -81 950 30 
7902 FORD ANALYST 7566 03-12 月 -81 3000 20 
7934 MILLER CLERK 7782 23-1 月 -82 1300 10 

2.DEPT 

DEPTNO 为 主键 字段 。 

SQL> desc dept; 

名 称 是 否 六 类 型 

DEPTNO NUMBER (2) 

DNAME VARCHAR2 (14) 

LOC VARCHAR2 (13) 

SQL> select * from dept; 
DEPTNO DNAME LOC 
10 ACCOUNTING NEW YORK 
20 RESEARCH DALLAS 
30 SALES CHICAGO 
40 OPERATIONS BOSTON 


3.DBA OBJECTS 


这 是 Oracle 的 一 个 字典 表 ， 在 119 R2 版 本 下 大 约 有 18000 条 记录 。 


SQL> DESC DBA_ OBJECTS; 


名 称 是 否 为 空 ”类 型 


OWNER VARCHAR2 (30) 
OBJECT NAME VARCHAR2 (128) 
SUBOBJECT NAME VARCHAR2 (30) 
OBJECT ID NUMBER 

DATA OBJECT ID NUMBER 
OBJECT TYPE VARCHAR2 (19) 
CREATED DATE 

LAST DDL TIME DATE 
TIMESTAME VARCHAR2 (19) 
STATUS VARCHAR2 (7) 
TEMPORRARY VARCHAR2 (1) 
GENERATED VARCHAR2 (1) 
SECONDARY VARCHAR2 (1) 
NAMESPACE NUMBER 
EDITION NAME VARCHAR2 (30) 
4.DBA _USRES 


这 是 Oracle 的 一 个 字典 表 ， 在 11g R2 版 本 下 大 约 有 20 条 记录 。 


SQL> desc dba users; 


名 称 是 否 为 空 类 型 
USERNAME, NOT NULL VARCHAR2 (30) 
USER_ID NOT NULL NUMBER 
PASSWORD VARCHAR2 (30) 
ACCOUNT_STATUS NOT NULL VARCHAR2 (32) 
LOCK_DATE DATE 

EXPIRY DATE DATE 

DEFAULT TABLESPACE NOT NULL VARCHAR2 (30) 
TEMPORARY TABLESPACE NOT NULL VARCHAR2 (30) 
CREATED 一 NOT NULL DATE 

PROFILE NOT NULL VARCHAR2 (30) 
INITIAL RSRC CONSUMER GROUP VARCHAR2 (30) 
EXTERNAL NAME VARCHAR2 (4000) 
PASSWORD VERSIONS VARCHAR2 (8) 
EDITIONS ENABLED VARCHAR2 (1) 
AUTHENTICATION TYPE VARCHAR2 (8) 


5.DBA TABLES 


这 是 Oracle 的 一 个 字典 表 ， 在 119 R2 版 本 下 大 约 有 1700 条 记录 。 


SQL> desc dba tables 


名 称 是 否 为 空 类 型 
OWNER NOT NULL VARCHAR2 (30) 
TABLE NAME NOT NULL VARCHAR2 (30) 
TABLESPACE NAME VARCHAR2 (30) 
CLUSTER_NRME VARCHAR2 (30) 
IOT NAME VARCHAR2 (30) 
STATUS VARCHAR2 (8) 
PCT_FREE NUMBER 
PCT_USED NUMBER 
INI_TRANS NUMBER 

MAX_ TRANS NUMBER 
INITIAL EXTENT NUMBER 

NEXT EXTENT NUMBER 

MIN EXTENTS NUMBER 

MAX_ EXTENTS NUMBER 
PCT_INCREASE NUMBER 
FREELISTS NUMBER 
FREELIST_ GROUPS NUMBER 
LOGGING VARCHAR2 (3) 
BACKED UP VARCHAR2 (1) 
NUM ROWS NUMBER 
BLOCKS NUMBER 
EMPTY BLOCKS NUMBER 

AVG SPACE NUMBER 

CHAIN CNT NUMBER 
AVG_ROW_LEN NUMBER 
AVG_SPACE FREELIST BLOCKS NUMBER 

NUM FREELIST BLOCKS NUMBER 
DEGREE VARCHAR2 (40) 
INSTANCES VARCHAR2 (40) 
CACHE VARCHAR2 (20) 
TABLE LOCK VARCHAR2 (8) 
SAMPLE SIZE NUMBER 

LAST ANALYZED DATE 
PARTITIONED VARCHAR2 (3) 
IOT TYPE VARCHAR2 (12) 
TEMPORARY VARCHAR2 (1) 
SECONDARY VARCHAR2 (1) 
NESTED VARCHAR2 (3) 
BUFFER POOL VARCHAR2 (7) 
FLASH CACHE VARCHAR2 (7) 
CELL FLASH CACHE VARCHAR2 (7) 
ROW MOVEMENT VARCHAR2 (8) 
GLOBAL STATS VARCHAR2 (3) 
USER_STATS VARCHAR2 (3) 
DURATION VARCHAR2 (15) 
SKIP CORRUPT VARCHAR2 (8) 
MONITORING VARCHAR2 (3) 
CLUSTER_ONNER VARCHAR2 (30) 
DEPENDENCIES VARCHAR2 (8) 
COMPRESSION VARCHAR2 (8) 
COMPRESS_FOR VARCHAR2 (12) 
DROPPED VARCHAR2 (3) 
READ ONLY VARCHAR2 (3) 
SEGMENT CREATED VARCHAR2 (3) 
RESULT CACHE VARCHAR2 (7) 


A.2 ”构造 测试 数据 


在 进行 测试 时 ， 经 常 需要 自己 构造 一 些 数据 ， 除 了 使 用 CTAS 从 系统 表 中 复制 一 些 数据 外 ， 还 可 以 应 


1. 层 次 查询 


从 9i 开 始 ，Oracle 提 供 了 丰富 的 层次 查询 语法 及 函数 ， 以 满足 层次 化 数 拉 


以 下 方法 。 


居 的 查询 和 格式 化 需求 。 应 用 其 中 的 某 些 特性 ， 可 以 很 方便 地 快速 构造 大 量 数 和 


一- 构造 序列 (rownum 方 法 ) 

select rownum rown from dual connect by rownum<5; 

// 增 增 序 列 

select rownumt+1l5 rown from dual connect by rownum<5; 
// 从 16 开 始 的 递增 序列 

select rownum-10 rown from dual connect by rownum<5; 
// 从 -9 开始 的 递增 序列 
select rownum/100+0.09, 
// 小 数 递 增 序列 


select 10-rownum rown from dual connect by rownum<5; 


rown from dual connect by rownum< 


(0.8-0.1) /0.01; 


// 递 减 序列 

select 3*rownum -9 rown from dual connect by rownum<5; 

// 等 差 间隔 序列 

select power (2, rownum) Town from dual connect by rownum<5; 

// 非 等 差 间 隔 序 列 

一 -构造 序列 (level 方 法 ) 

select level from dual connect by level<5; => 1、2、3、4 

一 构造 日 期 序列 

select to date ('2009-10-12', 'yyyy-mm-dd') + (rownum-1) from dual 

connect by rownum <= (to date ('2009-10-20', 'yyyy-mm-dd') - to date ('2009-10-12', 'yyyy-mm-dd') ) ; 
// 指 定 日 期 间 的 所 有 天 

select add months (to date ('2009-10'，'yYyYyyYyy-mm') , rownum-1) from dual 

connect by rownum <= months between (to date ('2012-10', 'yyyy-mm') , to date ('2009-10', ‘yyyy-mm') ) ; 
// 指 定 日 期 间 的 所 有 月 

create table 七 (time date) ; 

insert into t (time) values (to date ('20100514', 'yyyymmdd') ) ; 

insert into t (time) select to date ('20100514', 'yyyyrmdd') +level/24/60 from t connect by rownum <=10; 
// 插 入 指定 时 间 内 的 分 钟 数 


2. 文 本 加 载 


也 可 以 通过 操作 系统 构造 文本 文件 ， 通 过 SQL*Loader 加 载 到 数据 库 中 。 


seq 10000 > data.txt 

seq -w 100 > data.txt 

seq -f "%g, 1" 10 > data.txt 

seq 1001awk '{print $1", str"$1}' > data.txt 

for i in “seq -f "20090"%03g 305 320`; do echo ‘date -d $i '+%Y %m 5%d ”2>/dev/null `; done 


DDD 


附录 B SQL 优化 参数 


“ optimizer_index_caching: 这 个 参数 表示 在 SQL 语 句 执行 识 套 循环 或 者 In-List 方 式 执行 后 ， 通 过 索引 随机 读 取 访 问 数 据 ， 此 时 索引 块 被 缓存 到 缓存 中 的 概率 。 上 默认 值 为 0， 表 示 数 据 库 认为 高 速 缓 存 中 没 
有 索引 块 ; 当 设 为 100 时 ， 表 示 数 据 库 认 为 高 速 缓存 中 具有 所 有 索引 块 。 这 个 参数 设置 较 大 ， 将 降低 随机 访问 读 取 的 成 本 ， 进 而 提高 优化 器 选择 府 套 循环 或 In-List 执 行 方式 。 


“ optimizer_index_cost_adj: 这 个 参数 用 于 通过 索引 扫描 改变 访问 表 的 开销 。 参 数 可 用 值 范围 为 1 到 10000， 默 认 值 是 100。 这 个 参数 越 小 ， 表 访问 单个 块 的 成 本 就 越 低 ; 反之 ， 成 本 就 越 高 。 理 解 这 个 参数 
可 以 想象 这 个 参数 反映 执行 多 块 [/ 〇 (与 全 表 扫 描 有 关 ) 的 成 本 与 执行 单 块 /O (与 索引 读 取 有 关 ) 的 成 本 。 如 果 保持 这 个 参数 的 默认 值 100， 则 多 块 I/O 与 单 块 IO 的 成 本 相同 。 超 过 100， 数 值 越 大 会 使 单 
块 I/O 成 本 提高 ， 索 引 扫描 的 成 本 越 高 ， 从 而 导致 查询 优化 器 更 加 倾向 于 使 用 全 表 扫 描 。 相 反 ， 参 数 小 于 100， 数 值 越 小 ， 索 引 扫描 成 本 越 低 ， 查 询 优化 器 越 倾向 于 使 用 索引 扫描 。 


“ optimizer_mode: Oracle 为 基于 成 本 的 优化 器 提供 了 几 种 选择 。 
“ all_rows: 优化 器 将 寻找 能 够 在 最 短 的 时 间 内 完成 语句 的 执行 计划 。 该 参数 值 没 有 在 代码 中 构建 特别 的 约束 。 


“ first_rows_N: N 可 以 为 1、10、100 或 1000 (如 果 需 要 进一步 优化 ， 可 以 采用 first_rows (n) 提示 的 形式 ， 其 中 n 可 以 为 任意 正 整 数 ) 。 优 化 器 首先 通过 彻底 分 析 第 一 个 连接 顺序 来 估计 返回 行 的 总 数 
目 。 这 样 就 可 以 知道 查询 可 能 获得 的 整个 数据 集 的 片断 ， 并 重启 整个 优化 进程 ， 其 目标 在 于 找到 能 够 以 最 小 的 资源 消耗 返回 整个 数据 片断 的 执行 计划 。 这 是 9i 中 引入 的 。 


“ first_rows: 出 于 向 后 兼容 的 原因 ， 予 以 保留 。 该 选项 的 作用 是 在 于 寻找 能 够 在 最 短 时 间 内 返回 结果 的 第 一 行 的 执行 计划 。 

“ rule: 基于 规则 的 优化 器 已 经 过 时 了 ， 只 在 某 些 内 部 的 SQL 中 仍然 使 用 /#+tulex/ 提 示 ， 而 且 10g 中 最 终 不 再 支持 RBO 。 

:choose: 为 优化 器 提供 一 种 运行 时 选择 方式 ， 可 以 在 基于 规则 的 优化 器 和 al_rows 之 间 进 行 选择 。 
“ optimizer_features_enable: 限定 优化 器 的 特性 支持 到 特定 的 Oracle 版 本 。 在 升级 数据 库 时 ， 可 以 利用 它 来 避免 任何 优化 器 升级 带 来 的 变化 。 
: optimizer_dynamic_sampling: 指定 Oracle 的 动态 采样 策略 。optimizer_dynamic_sampling 的 默认 值 为 2 (意味 着 针对 没有 统计 信息 的 任何 表 都 采用 动态 采样 ) 。 
“ cursor sharing: 游标 共享 是 通过 参数 cursor sharing 来 控制 的 。 

EXACT: 只 有 当 发 布 的 SQL 语 和 句 与 缓存 中 的 语句 完全 相同 时 才 用 已 有 的 执行 计划 。 


: FORCE: 如 果 SQL 语句 是 字面 量 ， 则 迫使 Dptimizer 始 终 使 用 已 有 的 执行 计划 ， 无 论 已 有 的 执行 计划 是 不 是 最 佳 的 。 优 化 器 将 把 SQL 语句 所 有 字面 常量 替换 为 系统 产生 的 绑 定 变量 ， 并 检查 是 否 存在 
一 个 以 前 生产 的 共享 游标 可 以 用 于 修改 后 的 语句 。 


“ SIMILAR: 如 果 SQL 语 句 是 字面 量 ， 则 只 有 当 已 有 的 执行 计划 是 最 佳 时 才 使 用 它 ， 如 果 已 有 执行 计划 不 是 最 佳 则 重新 对 这 个 SQL 语 句 进 行 分 析 来 制定 最 佳 执 行 计划 。 首 先 将 字面 变量 蔡 换 为 绑 定 变 
量 ， 然 会 帘 视 绑 定 变量 的 值 。 如 果 有 必要 ， 将 对 该 语句 在 每 次 单独 的 分 析 调 用 中 对 输入 值 进行 优化 。 该 参数 指定 Oracle 在 存在 柱状 图 信息 时 ， 对 不 同 的 变量 值 重 新 解析 ， 从 而 可 以 利用 柱状 图 更 为 精确 地 指定 
SQL 执行 计划 。 即 当 存 在 柱状 图 时 ，similar 的 表现 和 exact 一 样 ; 当 柱 状 图 不 存在 时 ，similat 的 表现 和 force 相 同 。 


“ db_{keep_|recycle_|nK_}cache_size: 数据 库 高 速 缓存 的 大 小 。 由 特定 的 参数 指定 KEEP 池 、 回 收 池 、 黑 认 池 以 及 缓存 不 同 数据 块 大 小 的 池子 的 大 小 。 
' db_block_size: 数据 库 的 数据 块 大 小 。 


“ db_file_multiblock_read_count: 对 默认 的 块 尺 寸 来 说 ， 这 个 参数 指定 了 一 次 最 多 读 取 的 数据 块 数 目 。 在 多 块 读 的 情况 下 (全 表 扫 描 或 索引 快速 全 扫描 ) ， 数 据 库 使 用 的 最 大 LI/O 的 大 小 就 取决 于 
db_file_multiblock_read_count 和 db_block_size 的 乘积 。 


* memory_target: Oracle 的 SGA 和 PGA 内 存 的 目标 大 小 。 

“ pga_aggregate_target: 实例 可 供 消耗 的 总 体 的 PGA 内 存 的 目标 大 小 。 

“ hash_area_size: 内 存 哈 希 排序 的 工作 区 大 小 。 通 常 ， 只 有 在 参数 MEMORY_TARGET 与 PGA_AGGREGATE_TARGET 都 没有 设置 的 情况 ， 才 会 设置 此 参数 。 
“ sort_area_size: 内 存 中 排序 工作 区 的 大 小 。 只 有 在 参数 MEMORY_TARGET 与 PGA_AGGREGATE_TARGET 都 没有 设置 的 情况 下 才 有 效 。 


“ sga_target: Oracle SGA 的 目标 大 小 。 


附录 C SQL 优化 数据 字典 


“ V8SQL: 本 视图 存储 具体 的 SQL 语 自信 息 。 一 条 语句 可 以 映射 多 个 cursor ( 子 游标 ) ， 因 为 对 象 所 指 的 cursor 可 以 有 不 同 用 户 。 如 果 有 多 个 cursor 存 在 ， 由 VS$SQLAREA 为 所 有 cursor 提 供 集 合 信 
别 cursor 上 ，V9$SQL 可 被 使 用 。 该 视图 包含 cursor 级 别 资料 。 当 试图 定位 session 或 用 户 以 分 析 cursor 时 被 使 用 。plan_hash_value 列 存储 的 是 数值 表示 的 cursor 执 行 计划 ， 可 被 用 来 对 比 执行 计划 ， 不 必 一 行 一 行 对 
比 即 可 轻松 鉴别 两 条 执行 计划 是 否 相 同 ， 即 一 个 child cursor 对 应 一 行 。 


“ V$SQLAREA: 本 视图 持续 跟踪 所 有 shared pool 中 的 共享 cursor， 在 shared pool 中 的 每 一 条 SQL 语句 都 对 应 一 行 。 也 就 是 一 个 parent cursor 对 应 一 行 。 本 视图 在 分 析 SQL 语 句 资源 使 用 方面 非常 重要 。 每 条 
记录 都 显示 一 个 SQL 语 和 句 的 详细 统计 信息 ， 包 括 历史 以 来 的 执行 次 数 、 物 理 读 、 逻 辑 读 、 耗 费时 间 等 重要 信息 。 


< 


SQLTEXT: 本 视图 包括 shared pool 中 SQL 语 句 的 完整 文本 ， 一 条 SQL 语 句 可 能 分 成 多 个 块 被 保存 于 多 个 记录 内 。 其 按 每 行 64 字 节 分 布 ，piece 为 行 号 。V$SQLAREA 只 包括 前 1000 个 字符 。 


“ V3SQL_PLAN: 本 视图 提供 了 一 种 方式 检查 那些 执行 过 的 并 且 仍 在 缓存 中 的 cutrsor 的 执行 计划 。 本 视图 提供 的 信息 与 打印 出 的 EXPLAIN PLAN 非常 相似 ; 不 过 ，EXPLAIN PLAN 显示 的 是 理论 上 的 计 
划 ， 并 不 一 定 在 执行 的 时 候 就 会 被 使 用 ， 但 V$SQL_PLAN 中 包括 的 是 实际 被 使 用 的 计划 。 获 自 EXPLAIN PLAN 语句 的 执行 计划 跟 具 体 执行 的 计划 可 以 不 同 ， 因 为 cursor 可 能 被 不 同 的 session 参 数值 编译 (如 
HASH_AREA_SIZE) 。 


“VS$SQL_ PLAN_STATISTICS: 本 视图 从 行 级 别 显 示 每 个 child cursot 的 执行 情况 。 


`V$SQL_ SHARED_CURSOR: 这 个 视图 可 以 查看 游标 不 共享 的 具体 原因 。 


“VS$SQL SHARED_MEMORY: 该 视图 显示 有 关内 存 快照 共享 的 游标 信息 。 在 共享 池 中 共享 的 每 个 SQL 语 句 都 有 一 个 或 多 个 与 之 相关 的 子 对 象 。 每 个 子 对 象 包括 几 部 分 ， 其 中 一 个 是 上 下 文 堆栈 ， 它 拥 
有 查询 计划 。 
“ V3SQL_WORKAREA: 这 个 视图 显示 了 被 SQL 游 标 使 用 的 工作 区 的 信息 。 存 储 在 shared Pool 中 的 每 条 SQL 语句 都 有 一 个 或 多 个 子 游标 ， 它 们 能 被 VSSQL 显 示 。 而 V$SQL_WORKAREA 显 示 需 要 被 这 些 游 


标 所 使 用 的 工作 区 信息 。 可 以 将 它 与 V$SQL 进 行 关联 查询 。 


“ V3SQL_WORKAREA_ACTIVE: 这 个 视图 包含 了 系统 当前 分 配 的 工作 区 的 瞬间 信息 。 可 以 通过 字段 workarea_address 关 联 V$SQL_WORKAREA 来 查询 工作 区 信息 。 如 果 工 作 区 溢出 到 磁盘 ， 则 这 个 视图 
就 包含 了 这 个 工作 区 所 溢出 的 临时 段 的 信息 。 通 过 与 视图 V$TEMPSEG_USAGE 关 联 ， 可 以 得 到 更 多 的 临时 段 信 息 。 


“ V3SQL_WORKAREA_HISTOGRAM: 这 个 视图 包含 了 系统 分 配 的 工作 区 的 历史 信息 。 


. V$SQL_BIND_CAPTURE: 这 个 视图 显示 每 个 cursor 的 绑 定 变量 信息 。 


$SQL_BIND_DATA: 这 个 视图 显示 客户 机 为 每 个 游标 中 每 个 明确 绑 定 变量 发 送 的 绑 定 数据 ， 前 提 是 服务 器 中 可 得 到 这 个 数据 ， 其 中 游标 归属 于 查询 这 个 视图 的 会 话 。 


“VSSQL_BIND_METADATA: 查看 child cursor 的 绑 定 变量 情况 。 这 个 视图 显示 客户 机 为 每 个 游标 中 每 个 明确 绑 定 变量 提供 的 绑 定 元 数据 ， 其 中 的 游标 为 查询 这 个 视图 的 会 话 所 拥有 。 


“VS$SQL_ CS_SELECTIVITY: 这 个 视图 显示 与 每 个 子 游标 的 每 个 选择 条 件 相关 的 选择 性 范围 。 数 据 库 不 会 为 每 个 绑 定 变量 值 创建 一 个 子 游标 ， 而 是 将 具有 相同 选择 性 并 可 能 会 导致 生成 同一 个 执行 计划 
的 绑 定 变量 值 组 合 在 一 起 ， 生 成 一 个 新 的 子 游标 。 


< 


SQL_CS_STATISTICS: 这 个 视图 说 明 是 否 使 用 了 窥视 ， 并 展示 了 对 应 于 每 个 子 游标 的 相关 执行 统计 信息 。 根 据 这 些 统计 信息 ， 往 往 可 以 理解 为 什么 子 游标 采用 了 不 同 的 执行 计划 。 


附录 D SQL 优化 等 待 事件 


“ buffer busy waits: 当 一 个 会 话 将 数据 块 从 磁盘 读 到 内 存 中 时 ， 它 需要 找到 空闲 的 内 存 空间 来 存放 这 些 数据 块 ， 当 内 存 中 没有 空闲 的 空间 时 ， 就 会 产生 这 个 等 待 ; 除 此 之 外 ， 还 有 一 种 情况 就 是 会 话 在 
做 一 致 性 读 时 ， 需 要 构造 数据 块 在 菜 个 时 刻 的 前 映像 。 此 时 需要 申请 内 存 块 来 存放 这 些 新 构造 的 数据 块 ， 如 果 内 存 中 无 法 找到 这 样 的 内 存 块 ， 也 会 发 生 这 个 等 待 事件 。 


“buffer latch: 内 存 中 数据 块 的 存放 位 置 是 记录 在 一 个 哈 希 列表 当中 的 。 当 一 个 会 话 需要 访问 某 个 数据 块 时 ， 它 首先 要 搜索 这 个 哈 希 列表 ， 从 列表 中 获得 数据 块 的 地 址 ， 然 后 通过 这 个 地 址 去 访问 需要 的 
数据 块 ， 这 个 列表 Oracle 会 使 用 一 个 latch 来 保护 它 的 完整 性 。 当 一 个 会 话 需要 访问 这 个 列表 时 ， 需 要 获取 一 个 latch， 只 有 这 样 ， 才 能 保证 这 个 列表 在 这 个 会 话 的 浏览 当中 不 会 发 生疏 变 。 


“ db file sequential read: 通常 是 与 单个 数据 块 相关 的 读 取 操 作 ， 大 多 数 情况 下 读 取 一 个 索引 块 或 者 通过 索引 读 取 一 个 数据 块 ， 会 记录 这 个 等 待 。 该 事件 说 明 在 单个 数据 块 上 大 量 等 待 ， 该 值 过 高 通常 是 由 
于 表 间 连接 顺序 很 莉 糕 ， 或 者 使 用 了 非 选择 性 索引 。 通 过 将 这 种 等 待 与 statspack 报 表 中 已 知 其 他 问题 联系 起 来 〈 如 效率 不 高 的 SQL) ， 通 过 检查 确保 索引 扫描 是 必须 的 ， 并 确保 按 多 表 连 接 的 连接 顺序 来 调 
整 ，DB_CACHE_SIZE 可 以 决定 该 事件 出 现 的 频率 。 这 个 等 待 事件 在 实际 生产 数据 库 中 也 非常 常见 。 当 Ortacle 需 要 每 次 I/O 只 读 取 单 个 数据 块 这 样 的 操作 时 ， 会 产生 这 个 等 待 事件 。 最 常见 的 情况 有 索引 的 访 
问 ( 除 IFFS 以 外 的 方式 ) 、 回 滚 操 作 、 以 ROWID 的 方式 访问 表 中 的 数据 、 重 建 控制 文件 、 对 文件 头 做 DUMP 等 。 


“ db file scattered read: 这 是 一 个 用 户 操作 引起 的 等 待 事件 ， 当 用 户 发 出 每 次 I/O 需 要 读 取 多 个 数据 块 这 样 的 SQL 操作 时 ， 会 产生 这 个 等 待 事 件 ， 最 常见 的 两 种 情况 是 全 表 扫描 和 索引 快速 扫描 。 这 个 名 称 
中 的 scattered (发 散 ) 可 能 会 导致 很 多 人 认为 它 是 以 scattered 的 方式 来 读 取 数 据 块 的 ， 其 实 恰恰 相反 ， 当 发 生 这 种 等 待 事件 时 ，SQL 的 操作 都 是 顺序 读 取 数 据 块 的 ， 比 如 FTS 或 IFFS 方 式 。 其 实 这 里 scattered 指 
的 是 读 取 的 数据 块 在 内 存 中 的 存放 方式 。 它 们 被 读 取 到 内 存 中 后 ， 是 以 分 散 的 方式 存放 在 内 存 中 的 ， 而 不 是 连续 的 。 


“direct path read: 这 个 等 待 事件 发 生 在 会 话 中 ， 将 数据 块 直接 读 取 到 PGA 当 中 而 不 是 SGA 中 的 情况 ， 这 些 被 读 取 的 数据 通常 是 这 个 会 话 私有 的 数据 ， 所 以 不 需要 放 到 SGA 作 为 共享 数据 ， 因 为 这 样 做 没 
有 意义 。 这 些 数据 通常 是 来 自 于 临时 段 上 的 数据 ， 比 如 一 个 会 话 中 SQL 的 排序 数据 ， 并 行 执行 过 程 中 间 产 生 的 数据 ， 以 及 Hash join、Merge join 产生 的 排序 数据 ， 因 为 这 些 数据 只 对 当前 会 话 的 SQL 操作 有 意 
义 ， 所 以 不 需要 放 到 SGA 当 中 。 当 发 生 direct path read 等 待 事件 时 ， 意 味 着 磁盘 上 有 大 量 的 临时 数据 产生 ， 比 如 排序 、 并 行 执行 等 操作 ， 或 者 意味 着 PGA 中 空闲 空间 不 足 。 


“direct path write: 发 生 在 Oracle 直 接 从 PGA 写 数据 到 数据 文件 或 临时 文件 ， 这 个 操作 可 以 绕 过 SGA。 在 磁盘 排序 中 最 为 常见 。 对 于 这 种 情况 应 该 找到 操作 最 为 频繁 的 数据 文件 (如 果 是 排序 ， 很 有 可 能 
是 临时 文件 ) ， 分 散 负 载 。 

“ library cache lock: 这 个 等 待 事件 发 生 在 不 同 用 户 在 共享 池 中 由 于 并 发 操作 同一 个 数据 库 对 象 导致 的 资源 争 用 的 时 候 。 比 如 当 一 个 用 户 正 在 对 一 个 表 做 DDL 操 作 时 ， 其 他 的 用 户 如果 要 访问 这 张 表 ， 就 
会 发 生 library cache lock 等 待 事件 ， 它 要 一 直 等 到 DDL 操 作 完 毕 后 ， 才 能 继续 操作 。 


“ library cache pin: 这 个 等 待 事件 和 library cache lock 一 样 是 发 生 在 共享 池 中 并 发 操作 引起 的 等 待 事件 。 通 常 来 讲 ， 如 果 Oracle 要 对 一 些 PL/SQL 或 视图 这 样 的 对 象 做 重新 编译 ， 需 要 将 这 些 对 象 pin 到 共享 池 
中 。 如 果 此 时 这 个 对 象 被 其 他 的 对 象 持 有 ， 就 会 产生 一 个 library cache pin 的 等 待 。 


“ log file sync: 这 是 一 个 用 户 会 话 行为 导致 的 等 待 事件 。 当 一 个 会 话 发 出 一 个 commit 命 令 时 ，LGWR 进 程 会 将 这 个 事务 产生 的 redo log 从 logbuffer 里 写 到 磁盘 上 ， 以 保证 用 户 提交 的 信息 被 安全 地 记录 到 数 
据 库 中。 会话 发 出 commit 指 令 后 ， 需 要 等 待 LGWR 将 这 个 事务 产生 的 redo 成 功 写 入 到 磁盘 之 后 ， 才 可 以 继续 进行 后 续 的 操作 ， 这 个 等 待 事件 就 称 为 log file sync。 当 系统 中 出 现 大 量 的 log file sync 等 待 事件 时 ， 
应 该 检查 数据 库 中 是 否 有 用 户 在 做 频繁 的 提交 操作 。 这 种 等 待 事件 通常 发 生 在 OLTP 系 统 上 。OLTP 系 统 中 存在 很 多 小 的 事务 ， 如 果 这 些 事务 频繁 被 提交 ， 可 能 引起 大 量 log file sync 的 等 待 事件 。 


“ SQL*Net message from client: 表明 前 台 服务 器 进程 等 待 客户 进行 响应 。 这 个 等 待 事件 是 由 等 待 用 户 进程 的 响应 所 引起 的 ， 它 并 不 表明 数据 库 就 存在 什么 不 正常 。 如 果 网 络 出 现 故 障 时 ， 这 种 等 待 时 间 
就 会 经 常 发 生 。 


“ SQIXNet message to client: 这 个 等 待 事件 发 生 在 服务 器 端 向 客户 端 发 送 消息 的 时 候 。 当 服务 器 端 向 客户 端 发 送 消息 产生 等 待 时 ， 可 能 的 原因 是 用 户 端 太 繁忙 ， 无 法 及 时 接收 服务 器 端 送 来 的 消息 ， 也 
可 能 是 网 络 问题 导致 消息 无 法 从 服务 器 端 发 送 给 客户 端 。 


附录 E ”SQL 优 化 提示 


基于 代价 的 优化 器 是 很 聪明 的 ， 在 绝 大 多 数 情况 下 它 会 选择 正确 的 优化 器 ， 减 轻 了 DBA 的 负担 。 但 有 时 它 也 聪明 反 被 聪明 误 ， 选 择 了 很 差 的 执行 计划 ， 使 某 个 语句 的 执行 变 得 奇 慢 无 比 。 此 时 就 需要 
DBA 进 行人 为 的 干预 ， 告 诉 优化 器 使 用 指定 的 存 取 路 径 或 连接 类 型 生成 执行 计划 ， 从 而 使 语句 高 效 的 运行 。hints 是 Oracle 提 供 的 一 种 机 制 ， 用 来 告诉 优化 器 按照 告诉 它 的 方式 生成 执行 计划 。 


E.1 使 用 方法 


{DELETE | INSERT | SELECT|UPDATE} /*+ hint [text] [hint[text]]http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/O0EBPS/Text/... */ 
or 
{DELETE | INSERT | SELECT |UPDATE} --+ hint [text] [hint[text]]http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 


“ DELETE、INSERT、SELECT 和 UPDATE 是 标识 一 个 语句 块 开始 的 关键 字 ， 包 含 提示 的 注释 只 能 出 现在 这 些 关键 字 的 后 面 ， 否 则 提示 无 效 。 
“+” 号 表示 该 注释 是 一 个 提示 ， 该 加 号 必须 立即 跟 在 “/*” 的 后 面 ， 中 间 不 能 有 空格 。 

“ hint 是 下 面 介绍 的 具体 提示 之 一 ， 如 果 包 含 多 个 提示 ， 则 每 个 提示 之 间 需 要 用 一 个 或 多 个 空格 隔 开 。 

“ text 是 说 明 hint 的 注释 性 文本 。 


2. 对 象 


SELECT /*+ INDEX (table name index name) */ http://www.hzcourse.com/resource/readBook?path=/openresources/teach ebook/uncompressed/15654/0EBPS/Text/... 


“ table_name 是 必须 要 写 的 ， 且 如 果 在 查询 中 使 用 了 表 的 别名 ， 在 hint 也 要 用 表 的 别名 来 代替 表 名 。 


' index_name 可 以 不 必 写 ，Oracle 会 根据 统计 值 选 一 个 索引 。 


“如果 索引 名 或 表 名 写 错 了 ， 那 这 个 hint 就 会 被 名 略 。 


“ 如 果 指 定 对 象 是 视图 ， 需 要 按 此 方法 指定 。/*+hint view.tablehttp://www.hzcourse.com/resource/readBook?path=/openresources/teach_ebook/uncompressed/15654/OEBPS/Text/...*/， 其 中 table 是 view 中 的 


表 。 


E.2 ”提示 一 一 最 优化 目标 


` OPT_PARAM: 这 个 提示 的 作用 就 是 使 我 们 在 菜 条 语句 中 指定 茶 个 系统 参数 值 。 在 Oracle 中 存在 许多 参数 能 够 影响 SQL 的 查询 计划 ， 如 hash_join_enabled、optimizer_index_cost_adj 等 。 正 确 调整 这 些 参 
数 能 够 解决 不 少 SQL 引 起 的 性 能 问题 。 但 是 ， 在 调整 这 些 参数 时 需要 注意 一 点 ， 他 们 是 对 整个 实例 其 作用 的 。 他 们 的 影响 范围 如 此 之 大 。Oracle 10g R2 就 提供 了 一 个 这 样 的 提示 一 一 opt_param， 可 以 在 语句 一 
级 调整 参数 设置 。 


“ ALL_ROWS: 为 实现 查询 语句 整体 最 优化 而 引导 优化 器 制定 最 少 成 本 的 执行 计划 。 这 个 提示 会 使 优化 器 选择 一 条 可 最 快 检 索 所 有 查询 行 的 路 径 ， 而 代价 就 是 在 检索 一 行 数据 时 ， 束 度 很 慢 。 


“ FIRST_ROWS: 为 获得 最 佳 响应 时 间 而 引导 优化 器 制定 最 少 成 本 的 执行 计划 。 这 个 提示 会 使 优化 器 选择 可 最 快 检索 出 查询 的 第 一 行 〈 或 指定 行 ) 数据 的 路 径 ， 而 代价 就 是 检索 很 多 行 时 速度 就 会 很 
慢 。 利 用 FIRST_ROWS 来 优化 的 行 数 ， 默 认 值 为 1， 这 个 值 介 于 10 到 1000 之 间 ， 这 个 使 用 FIRST_ROWS (n) 的 新 方法 是 完全 基于 代价 的 方法 。 它 对 n 很 敏感 ， 如 果 n 值 很 小 ，CBO 〇 就 会 生成 包含 庶 套 循环 以 及 
索引 查找 的 计划 ; 如 果 n 很 大 ，CBO 会 生成 由 哈 希 连接 和 全 表 扫 描 组 成 的 计划 (类似 ALL_ROWS) 。 


:. CHOOSE: 依据 8QL 中 所 使 用 到 的 表 的 统计 信息 存在 与 否 ， 来 决定 使 用 RBO 还 是 CBO。 在 CHOOSE 模 式 下 ， 如 果 能 够 参考 表 的 统计 信息 ， 则 将 按照 ALL_ROWS 方 式 执 行 。 除 非 在 查询 中 的 所 有 表 都 没 
有 经 过 分 析 ， 否 则 CHOOSE 提 示 会 对 整个 查询 使 用 基于 代价 的 优化 。 如 果 在 多 表 连 接 中 有 一 个 表 经 过 分 析 ， 那 么 就 会 对 整个 查询 进行 基于 代价 的 优化 。 


:RULE: 使 用 基于 规则 的 优化 器 来 实现 最 优化 执行 ， 即 引导 优化 器 根据 优先 顺序 规则 来 决定 查询 条 件 中 所 使 用 到 的 索引 或 运算 符 的 执行 顺序 来 制定 执行 计划 。 这 个 提示 强制 Oracle 优 先 使 用 预定 义 的 一 
组 规则 ， 而 不 是 对 数据 进行 统计 ; 同时 该 提示 还 会 使 这 个 语句 避免 使 用 其 他 提示 ， 除 了 DRIVING_SITE 和 ORDERED (不 管 是 否 进行 基于 规则 的 优化 ， 这 两 个 提示 都 可 使 用 ) 。 
E.3 ”提示 一 一 数据 读 取 方 法 

“ FULL: 告诉 优化 器 通过 全 表 扫 描 方式 访问 数据 。 这 个 提示 只 对 所 指定 的 表 进行 全 表 扫描 ， 而 不 是 查询 中 的 所 有 表 。FULL 提 示 可 以 改善 性 能 。 这 主要 是 因为 它 改变 了 查询 中 的 驱动 表 ， 而 不 是 因为 全 
表 扫 描 。 在 使 用 其 他 某 些 提 示 时 ， 也 必须 使 用 FULL 提 示 。 只 有 访问 整个 表 时 ， 才 可 利用 CACHE 提 示 将 表 进 行 缓存 。 并 行 组 中 的 某 些 提示 也 必须 使 用 全 表 扫 描 。 

:ROWID: 按照 ROWID 方 式 读 取 表 。 

: CLUSTER: 引导 优化 器 通过 扫描 聚 答 索引 来 从 索引 表 中 读 取 数据 。 


* HASH: 引导 优化 器 按照 哈 希 扫描 的 方式 从 表 中 读 取 数 据 。 


“ INDEX: 告诉 优化 器 对 指定 表 通 过 索引 的 方式 访问 数据 。 当 访问 数据 会 导致 结果 集 不 完整 时 ， 优 化 器 将 忽略 这 个 Hint。 这 个 提示 会 使 优化 器 选择 提示 中 所 指定 的 索引 。 每 个 表 上 有 多 个 索引 可 以 指 
定 ， 但 通常 只 需 在 给 定 查询 中 指定 限制 最 多 的 索引 〈 吕 免 将 每 个 索引 的 结果 合并 ) 。 如 果 已 经 指定 多 个 索引 ，Oracle 将 选择 指定 的 索引 《一 个 或 多 个 ) ， 因 此 在 指定 索引 时 一 定 要 注意 ， 否 则 提示 可 能 会 被 改 
写 。 如 果 没 有 指定 索引 ，INDEX 提 示 将 不 会 进行 全 表 扫 描 ， 即 使 没有 指定 任何 索引 ， 优 化 器 也 会 为 这 个 查询 选择 最 佳 的 索引 。 


“NO_INDEX: 告诉 优化 器 对 指定 表 不 允许 使 用 索引 。 这 个 提示 会 禁止 优化 器 使 用 指定 索引 。 可 以 在 删除 不 必要 的 索引 之 前 在 许多 查询 中 禁止 索引 。 如 果 使 用 了 NO_INDEX， 但 是 没有 指定 任何 索引 ， 
则 会 执行 全 表 扫 描 。 如 果 对 某 个 索引 同时 使 用 了 NO_INDEX 和 会 之 产生 冲突 的 提示 (如 INDEX) ， 这 时 两 个 提示 都 会 被 忽略 。 


“INDEX_ COMBINE: 告诉 优化 器 强制 选择 位 图 索引 。 这 个 提示 会 使 优化 器 合并 表 上 的 多 个 位 图 索引 ， 而 不 是 选择 其 中 最 好 的 索引 《这 是 INDEX 提 示 的 用 途 ) 。 还 可 以 使 用 [NDEX_combine 指 定单 个 
索引 (对 于 指定 位 图 索引 ， 该 提示 优先 于 INDEX 提 示 ) 。 对 于 B 树 索引 ， 可 以 使 用 AND_EQUAL 提 示 而 不 是 这 个 提示 。 


“INDEX JOIN: 索引 关联 ， 当 谓词 中 引用 的 列 上 都 有 索引 的 时 候 ， 可 以 通过 索引 关联 的 方式 来 访问 数据 。 


“ INDEX_FFS: 告诉 优化 器 以 INDEX FFS (index fast full scan) 的 方式 访问 数据 。INDEX_FFS 提 示 会 执行 一 次 索引 的 快速 全 局 扫描 。 这 个 提示 只 访问 索引 ， 而 不 是 对 应 的 表 。 只 有 查询 需要 检索 的 信息 
都 在 索引 上 时 ， 才 使 用 这 个 提示 。 特 别 在 表 有 很 多 列 时 ， 使 用 该 提示 可 以 极 大 地 改善 性 能 。 


“ INDEX _ SS: 强制 使 用 index skip scan 的 方式 访问 索引 。 当 在 一 个 联合 索引 中 ， 某 些 谓词 条 件 并 不 在 联合 索引 的 第 一 列 时 (或 者 谓词 并 不 在 联合 索引 的 第 一 列 时 ) ， 可 以 通过 index skip scan 来 访问 索引 获 
得 数据 。 当 联合 索引 第 一 列 的 唯一 值 很 少时 ， 使 用 这 种 方式 比 全 表 扫 描 的 方式 效率 要 高 。 


:NO_INDEX SS: 引导 优化 器 不 对 该 提示 所 指定 的 表 索 引 来 进行 跳跃 式 扫描 。 


E4 ”提示 一 一 查询 转换 


“ USE_CONCAT: 将 含有 多 个 OR 或 者 IN 运 算 符 所 连接 起 来 的 查询 语句 分 解 为 多 个 单一 查询 语句 ， 并 为 每 个 单一 查询 语句 选择 最 优化 查询 路 径 ， 然 后 再 将 这 些 最 优化 查询 路 径 结 合 在 一 起 ， 以 实现 整体 
查询 语句 的 最 优化 目的 。 只 有 在 驱动 查询 条 件 中 包含 OR 的 时 候 ， 才 可 以 使 用 该 提示 。 


" NO_EXPAND: 引导 优化 器 不 要 为 使 用 OR 运算 符号 (或 IN 运 算 符 ) 的 条 件 制定 相互 结合 的 执行 计划 。 正 好 和 USE_CONCAT 相 反 。 


"REWRITE: 当 表 连接 的 对 象 是 数据 量 比较 大 的 表 或 者 需要 获得 使 用 统计 函数 处 理 过 的 结果 时 ， 为 了 提高 执行 速度 可 预先 创建 物化 视图 。 当 用 户 要 求 查询 某 个 查询 语句 时 ， 优 化 器 会 在 从 表 中 和 从 物化 
视图 中 读 取 数 据 的 两 种 方法 中 选择 一 个 更 有 效 的 方法 来 读 取 数 据 。 该 执行 方法 称 为 查询 重 写 。 使 用 REWRITE 提 示 引 导 优 化 器 按照 该 方式 执行 。 如 果 在 该 提示 中 指定 了 物化 视图 的 名 称 ， 则 优化 器 将 会 不 惜 代 
价 而 条 件 地 从 该 物化 视图 读 取 数 据 。 此 时 优化 器 不 会 考虑 使 用 提示 中 没有 指定 的 其 他 物化 视图 。 如 果 提示 中 没有 指定 物化 视图 的 名 称 ， 则 优化 器 同样 会 不 惜 代 价 从 可 以 使 用 的 物化 视图 中 选择 一 个 来 使 用 。 


:NOREWRITE/NO_REWRITE: 在 使 用 该 提示 的 情况 下 ， 即 使 参数 QUERY_ REWRITE_ENABLED 设 置 为 TRUE ， 也 仍然 可 以 引导 优化 器 不 要 执行 查询 重 写 的 操作 。 提 示 这 个 提示 会 使 得 查询 仍然 从 原 
表 中 得 到 最 新 数据 值 。 


“REWRITE_ON_ERROR: 由 于 不 存在 比较 合适 的 物化 视图 ， 所 以 使 得 优化 器 无 法 执行 查询 重 写 操作 。 在 此 情况 下 ， 如 果 使 用 该 提示 ， 则 会 发 生 ORA-30393 错 误 ， 从 而 中 断 查询 语句 的 执行 。 


“ MERGE: 为 了 能 以 最 优 方式 从 视图 或 者 庶 套 视图 中 读 取 数据 ， 通 过 变换 查询 语句 来 直接 读 取 视图 使 用 的 基 表 数据 ， 该 过 程 被 称 为 视图 合并 。 不 同 的 情况 其 具体 使 用 类 型 也 有 所 不 同 。 该 提示 主要 在 视 
未 发 生 合并 时 被 使 用 。 尤 其 是 对 比较 复杂 的 视图 或 者 庶 套 视图 (比如 使 用 了 GROUP BY 或 DISTINC 的 视图 ) 使 用 该 提示 ， 有 时 会 取得 非常 好 的 效果 。 


“ NO_MERGE: NO_MERGE 提 示 阻 止 优化 器 在 视图 (存储 的 以 及 内 联 的 ) 上 的 自动 操作 以 及 在 子 查询 中 的 非 相关 操作 。 从 技术 上 说 ， 它 只 是 阻止 了 复杂 视图 归并 (complex view merging) 的 发 生 。 如 
果 想 要 真正 阻止 归并 连接 ， 除 非 升 级 到 10g 并 使 用 no_use_merge 提 示 ， 否 则 没有 直接 可 用 的 提示 。 


“ FACT: 在 星 型 转换 连接 中 为 指定 事实 表 而 使 用 该 提示 ， 用 来 帮助 优化 器 选择 正确 的 事实 表 。 
" NO_FACT: 不 要 将 该 提示 所 指定 的 表 作 为 事实 表 来 使 用 。 


“ STAR_TRANSFORMATION: 引导 优化 器 按照 星 型 转换 连接 的 方式 执行 表 连 接 。 它 是 多 个 数据 量 较 少 的 维度 表 和 事实 表 各 自 通过 使 用 位 图 索引 来 缩减 查询 范围 的 连接 方式 。 在 该 连接 方式 中 ， 优 化 器 
对 查询 语句 进行 转换 之 后 再 制定 执行 计划 。 


* NO_STAR_TRANSFORMATION: 不 使 用 星 型 转换 连接 。 
“ UNNEST: 提示 优化 器 将 子 查询 转换 为 连接 的 方式 。 也 就 是 引导 优化 器 合并 子 查询 和 主 查询 并 且 将 其 向 连接 类 型 转换 。 


“NO_UNNEST: 引导 优化 器 让 子 查询 能 够 独立 执行 完毕 之 后 再 跟 外 围 的 查询 做 FILTER。 


E.5 ”提示 一 一 表 连 接 顺 序 


“IEADING: 引导 优化 器 使 用 LEADING 指 定 的 表 作 为 表 连 接 顺 序 中 的 第 一 个 表 。 该 提示 既 与 FROM 中 所 描述 的 表 的 顺序 无 关 ， 也 与 作为 调整 表 连 接 顺 序 的 ORDERED 提 示 不 同 ， 并 且 在 使 用 该 提示 时 
并 不 需要 调整 FROM 中 所 描述 的 表 的 顺序 。 当 该 提示 与 ORDERED 提 示 同 时 使 用 时 ， 该 提示 被 忽略 。 


“ ORDERED: 引导 优化 器 按照 FROM 中 所 描述 的 表 的 顺序 执行 连接 。 如 果 和 LEADING 提 示 被 一 起 使 用 ， 则 LEADING 提 示 将 被 忽略 。 由 于 ORDERED 只 能 调整 表 连 接 的 顺序 并 不 能 改变 表 连 接 的 方 
式 ， 所 以 为 了 改变 表 的 连接 方式 ， 经 常 将 USE_NL、USE_MERGE 提 示 与 ORDERED 提 示 放 在 一 起 使 用 。 
E.6 提示 一 一 表 连 接 操作 

“USE_NL: 使 用 该 提示 引导 优化 器 按照 嵌 套 循环 连接 方式 执行 表 连 接 。 它 只 是 指出 表 连 接 的 方式 ， 对 于 表 连 接 顺 序 不 会 有 任何 影响 。 

“ NO_USE_NL: Hint no_use_nl 使 CBO 执 行 循环 谋 套 ， 通 过 把 指定 表格 作为 内 部 表格 ， 把 每 个 指定 表格 连接 到 另 一 原始 行 。 


“ USE_NI, WITH_INDEX: 这 项 hint 使 CBO 通 过 赃 套 循环 把 特定 的 表格 加 入 到 另 一 原始 行 。 只 有 在 以 下 情况 中 ， 它 才 使 用 特定 表格 作为 内 部 表格 。 如 果 没 有 指定 标签 ，CBO 必 须 可 以 使 用 一 些 标签 ， 且 
这 些 标签 至 少 有 一 个 作为 索引 键 值 加 入 判断 ; 反之 ，CBO 必 须 能 够 使 用 至 少 有 一 个 作为 索引 键 值 加 入 判断 的 标签 。 


:USE_MERGE: 引导 优化 器 按照 排序 合并 连接 方式 执行 连接 。 在 有 必要 的 情况 下 ， 推 荐 将 该 提示 与 ORDERED 提 示 一 起 使 用 。 
“NO_USE_MERGE: 此 hint 使 CBO 通 过 把 指定 表格 作为 内 部 表格 的 方式 ， 拒 绝 sotrt-merge 把 每 个 指定 表格 加 入 到 另 一 原始 行 。 


" USE_HASH: 该 提示 引导 优化 器 按照 哈 希 连接 方式 执行 连接 。 在 执行 哈 希 连接 时 ， 如 果 由 于 某 一 边 的 表 比 较 小 ， 从 而 可 以 在 内 存 中 实现 哈 希 连接 ， 那 么 就 能 够 获得 非常 好 的 执行 速度 。 由 于 在 大 部 分 
情况 下 优化 器 会 通过 对 统计 信息 的 分 析 来 决定 Build Input 和 Prove Input， 所 以 建议 不 要 使 用 ORDERED 提 示 随 意 改 变 表 的 连接 顺序 。 但 是 当 优化 器 没 能 做 出 正确 判断 时 ， 或 者 像 从 该 套 视图 中 所 获得 的 结果 集 


合 那样 不 具备 统计 信息 时 ， 可 以 使 用 该 提示 。 

:NO_USE_HASH: 此 hint 使 CBO 通 过 把 指定 表格 作为 内 部 表格 的 方式 ， 拒 绝 hash joins 把 每 个 指定 表格 加 入 到 另 一 原始 行 。 引 导 优化 器 不 要 按照 哈 希 连接 的 方式 执行 连接 ， 而 是 用 其 他 方式 执行 表 连 接 。 
E.7 ”提示 一 一 并 行 相关 

" PARALLEL: 指定 SQL 执行 的 并 行 度 ， 这 个 值 将 会 覆盖 表 自 身 设 定 的 并 行 度 。 如 果 这 个 值 为 defanlt，CBO 使 用 系统 参数 。 

“ NOPARALLEL/NO_PARALLEL: 在 SQL 语句 禁止 使 用 并 行 。 在 有 些 版 本 中 用 NO_PARALLEL 提 示 来 代替 NOPARALLEL 提 示 。 

“ PQ_DISTRIBUTE: 为 了 提高 并 行 连接 的 执行 速度 ， 使 用 该 提示 来 定义 使 用 何 种 方法 在 主 从 进程 之 间 (例如 生产 者 进程 和 消费 者 进程 ) 分 配 各 连接 表 的 数据 行 。 

“ PARALLEL INDEX: 为 了 按照 并 行 操作 的 方式 对 分 区 索引 进行 索引 范围 扫描 而 使 用 该 提示 ， 并 且 可 以 指定 进程 的 个 数 。 

:NO_PARALLEL_ INDEX: 创建 或 者 修改 索引 时 如 果 设置 了 PARALLEL 参数 ， 而 在 SQL 中 如 果 使 用 了 该 提示 ， 则 优化 器 将 忽视 该 索引 上 的 PARALLEL 参数 ， 按 照 非 并 行 操作 的 方式 进行 索引 范围 扫描 。 


在 有 些 版 本 中 ， 用 NO_PARALLEL INDEX 提示 来 代替 NOPARALLEL INDEX 提示 。 


E.8 提示 一 一 其 他 


" APPEND: 让 数据 库 以 直接 加 载 的 方式 (direct load) 将 数据 加 载 入 库 。 这 个 提示 不 会 检查 当前 是 否 有 播 入 所 需要 的 块 空间 ， 相 反 它 会 直接 将 数据 添加 到 新 块 中 。 这 样 会 浪费 空间 ， 但 可 以 提高 插入 的 
性 能 。 需 要 注意 的 是 ， 数 据 将 被 存储 在 HWM 之 上 的 位 置 。 


“ APPEND_VALUES: 在 11.2 中 ，Oracle 新 增 了 APPEND_VALUES 提 示 ， 使 得 INSERT INTO VALUES 语 句 也 可 以 使 用 直接 路 径 插入 。 
“NOAPPEND: 这 个 提示 改写 PARALLEL 提示 (PARALLEL 提示 在 默认 情况 下 使 用 APPEND 提 示 ) ， 在 使 用 新 块 之 前 检查 当前 块 中 是 否 有 剩余 空间 。 


“ CACHE: 引导 优化 器 将 通过 全 表 扫描 方式 获取 的 数据 块 缓存 在 LRU 列 表 的 最 近 、 最 常 使 用 端 ， 这 样 可 以 使 数据 块 持久 保留 在 数据 库 实例 缓存 中 。 数 据 量 比较 少 的 表 使 用 起 来 比较 有 效 。 使 用 该 提示 ， 
优化 器 将 无 视 表 中 已 经 定义 的 默认 缓存 属性 。 


"NOCACHE: 引导 优化 器 将 通过 全 表 扫描 方 式 获 取 的 数据 块 缓存 在 LRU 列 表 的 最 后 位 置 ， 这 样 可 以 让 数据 库 实 例 缓存 中 的 这 些 数据 块 被 优先 清除 。 这 是 优化 器 在 Buffer Cache 中 管理 数据 块 的 默认 方法 
( 仅 针 对 全 表 扫 描 ) 。 


“ PUSH_PRED: 使 用 该 提示 可 以 将 视图 或 识 套 视图 以 外 的 查询 条 件 推 入 到 视图 之 内 。 


" NO_PUSH_PRED: 使 用 该 提示 确保 视图 或 庶 套 视图 以 外 的 查询 条 件 不 被 推 入 视图 内 部 。 


“ PUSH_SUBQ: 使 用 该 提示 引导 优化 器 为 不 能 合并 的 子 查询 制定 执行 计划 。 不 能 合并 的 子 查询 被 优先 执行 之 后 ， 该 子 查询 的 执行 结果 将 扮演 缩减 主 查 询 数 据 查 询 范 围 的 提供 者 角色 。 通 常 在 无 法 执行 子 
查询 合并 的 情况 下 ， 子 查询 扮演 的 都 是 检验 者 角色 ， 所 以 子 查询 一 般 被 放 在 最 后 执行 。 在 无 法 被 合并 的 子 查 询 拥有 较 少 的 结果 行 ， 或 者 该 子 查询 可 以 缩减 主 查询 查询 范围 的 情况 下 ， 可 以 使 用 该 提示 引导 优 
化 器 最 大 程度 地 将 该 子 查询 放 在 前 面 执行 ， 以 提高 执行 速度 。 但 如 果子 查询 执行 的 是 远程 表 或 者 排序 合并 连接 的 一 部 分 连接 结果 ， 则 该 提示 将 不 起 任何 作用 。 


:NO_PUSH SUBQ: 使 用 该 提示 将 引导 优化 器 将 不 能 实现 合并 的 子 查询 放 在 最 后 执行 。 在 子 查询 无 法 缩减 主 查询 的 查询 范围 ， 或 者 执行 子 查询 开销 较 大 的 情况 下 ， 将 这 样 的 子 查询 放 在 最 后 执行 可 以 在 
某 种 程度 上 提高 整体 的 执行 效率 。 也 就 是 说 ， 尽 可 能 地 使 用 其 他 查询 条 件 最 大 程度 地 缩减 查询 范围 之 后 ， 再 执行 子 查询 。 
" QB_NAME: 使 用 该 提示 为 查询 语句 块 命名 ， 在 其 他 查询 语句 块 可 以 直接 使 用 该 查询 语句 块 的 名 称 。 


` CURSOR_SHARING_EXACT: 在 将 参数 CURSOR_SHARING 的 值 置 为 EXACT 时 ， 不 将 WHERE 条 件 中 指定 的 常量 转换 为 绑 定 变量 来 进行 解析 。 将 参数 CURSOR_SHARING 的 值 置 为 FORCE 或 者 
SMILAR 时 ， 即 使 在 查询 条 件 中 使 用 了 常量 ， 优 化 器 也 会 将 该 常量 视 为 绑 定 变量 来 制定 执行 计划 ， 从 而 在 很 大 程度 上 提高 执行 计划 的 共享 性 。 在 有 些 情况 下 ， 也 可 以 通过 命令 alter session 来 改变 该 参数 的 值 。 
在 参数 CURSOR_SHARING 的 值 为 FORCE 或 者 SIMILAR 时 ， 由 于 优化 器 不 能 根据 SQL 中 所 指定 的 不 同 值 来 制定 出 不 同 的 执行 计划 ， 所 以 为 了 获得 和 CURSOR_SHARING 参 数值 为 EXACT 时 相同 的 效果 而 使 用 


该 提示 。 


“ DRIVING _SITE: 这 个 提示 在 分 布 式 数据 库 操 作 中 有 用 。 指 定 表 是 处 理 连接 所 在 的 位 置 。 可 以 限制 通过 网 络 处 理 的 信息 量 。 此 外 ， 还 可 以 建立 远程 表 的 本 地 视图 来 限制 从 远程 站 点 检索 的 行 。 本 地 视 
图 应 该 有 WHERE 子 句 ， 从 而 视图 可 以 在 将 行 发 送 回 本 地 数据 库 之 前 限制 从 远程 数据 库 返 回 的 行 。 


:DYNAMIC_SAMPLING: 提示 SQL 执 行 时 动态 采样 的 级 别 。 这 个 级 别 为 0~10， 它 将 覆盖 系统 默认 的 动态 采样 级 别 。 等 级 越 高 ， 所 获得 统计 信息 的 准确 率 越 高 。 该 提示 的 功能 就 是 为 了 确保 将 动态 采样 
原理 应 用 在 单个 SQL 中 。 


“ SPREAD_MIN_ANALYSIS: 使 用 这 个 hint， 你 可 以 忽略 一 些 关 于 (如 详细 的 关系 依赖 图 分 析 等 ) 电子 表格 的 编译 时 间 优 化 规则 。 其 他 的 一 些 优 化 ， 如 创建 过 滤 以 有 选择 性 地 定位 电子 表格 访问 结构 并 
限制 修订 规则 等 ， 得 到 了 继续 使 用 。 在 规则 数 非常 大 的 情况 下 ， 电 子 表格 分 析 会 很 长 。 这 一 提示 可 以 帮助 我 们 减少 由 此 产生 的 数 以 百 小 时 计 的 编译 时 间 。 


“ SPREAD_NO_ANALYSIS: 通过 这 一 hint， 使 无 电子 表格 分 析 成 为 可 能 。 同 样 ， 使 用 这 一 hint 可 以 忽略 修订 规则 和 过 滤 产 生 。 如 果 存 在 电子 表格 分 析 ， 编 译 时 间 可 以 被 减少 到 最 低 程度 。 
" MERGE_AJ: 这 个 提示 将 NOT IN 子 查询 转换 为 排序 合并 的 反 连 接 。 


: AND_EQUAL: 这 个 提示 会 使 优化 器 合并 表 上 的 多 个 索引 ， 而 不 是 选择 其 中 最 好 的 索引 (这 是 INDEX 提 示 的 用 途 ) 。 这 个 提示 与 前 面 的 INDEX JOIN 提示 有 区 别 ， 以 此 指定 的 合并 索引 随后 需 访 问 
表 ， 而 INDEX_ JOIN 提示 则 只 需 访 问 索 引 。 如 果 发 现 需 经 常用 到 这 个 提示 ， 可 能 需要 删除 这 些 单个 索引 而 改 用 一 个 组 合 索引 。 需 要 查询 条 件 里 面包 括 所 有 索引 列 ， 然 后 取得 每 个 索引 中 得 到 的 ROWID 列 表 。 
然后 对 这 些 对 象 做 merge join， 过 滤 出 相同 的 ROWID 后 再 去 表 中 获取 数据 或 者 直接 从 索引 中 获得 数据 。 在 10g 中 ，and_equal 已 经 废 齐 了 ， 只 能 通过 hint 才 能 生效 。 


“ CARDINALITY: 此 hint 定 义 了 对 由 查询 或 查询 部 分 返回 的 基数 的 评价 。 注 意 如 果 没 有 定义 表格 ， 基 数 是 由 整个 查询 返回 的 总 行 数 。 


“SELECTIVITY: 此 hint 定 义 了 对 查询 或 查询 部 分 选择 性 的 评价 。 如 果 只 定义 了 一 个 表格 ， 则 选择 性 就 是 指 在 所 定义 表格 里 满足 单一 表格 判断 的 行 部 分 与 整体 的 一 个 选择 。 如 果 定 义 了 一 系列 表格 ， 选 
择 性 就 是 指 在 合并 所 有 判断 的 全 部 表格 后 ， 所 得 结果 中 的 行 部 分 与 整体 的 一 个 选择 。 然 而 ， 注 意 如 果 hints CARDINALITY 和 SELECTIVITY 都 定义 在 同样 的 一 批 表 格 ， 二 者 都 会 被 忽略 。 


